
摘要
面部表情识别(Facial Expression Recognition, FER)是一项机器学习任务,旨在识别人类的面部表情。尽管近年来已有研究在性能上取得显著提升,但在真实场景(in the wild)及复杂条件下的FER仍面临挑战。本文提出一种基于MobileNetV1的轻量级分块与注意力网络——PAtt-Lite,以提升在复杂条件下的FER性能。该方法采用截断的ImageNet预训练MobileNetV1作为主干特征提取器。在原模型被截断的层位置,引入一种新型的分块特征提取模块,用于捕获关键的局部面部特征,从而增强MobileNetV1的特征表达能力,尤其在复杂环境下表现更为突出。此外,本文还设计了一种注意力分类器,以提升对极轻量级特征提取器所生成的分块特征图的学习能力。在多个公开基准数据集上的实验结果验证了所提方法的有效性。PAtt-Lite在CK+、RAF-DB、FER2013、FERPlus以及RAF-DB和FERPlus的复杂条件子集上均取得了当前最优(state-of-the-art)的识别性能。
代码仓库
jlrex/patt-lite
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| facial-expression-recognition-on-ck | PAtt-Lite | Accuracy (7 emotion): 100.00 |
| facial-expression-recognition-on-fer-1 | PAtt-Lite | Accuracy: 95.55 |