3 个月前

用于面部表情识别的局部多头通道自注意力机制

用于面部表情识别的局部多头通道自注意力机制

摘要

自2017年Transformer架构提出以来,学术界已涌现出大量尝试将自注意力机制引入计算机视觉领域的研究。本文提出一种新型自注意力模块——LHC(局部多头通道自注意力,Local (multi) Head Channel self-attention),该模块可轻松集成至几乎任何卷积神经网络中,且专为计算机视觉任务设计。LHC的设计基于两个核心思想:其一,我们认为在计算机视觉领域,利用自注意力机制的最佳方式应是通道维度上的应用,而非目前研究较多的空间注意力;同时,卷积操作不会像在自然语言处理中那样被注意力模块所取代;其二,局部化方法相较于全局注意力,具有更大潜力克服卷积操作的固有局限性。基于LHC模块构建的LHC-Net在著名的FER2013人脸表情识别数据集上取得了新的最优性能,同时相比先前的最先进方法,显著降低了计算复杂度,并对“主干”网络架构带来了更小的计算开销。

代码仓库

bodhis4ttva/lhc_net
官方
tf
GitHub 中提及

基准测试

基准方法指标
facial-expression-recognition-on-fer2013LHC-Net
Accuracy: 74.42

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于面部表情识别的局部多头通道自注意力机制 | 论文 | HyperAI超神经