摘要
面部表情识别(Facial Expression Recognition, FER)是一项具有挑战性的任务,有助于提升人机交互的自然性。本文聚焦于单张“野生”(in-the-wild, ITW)图像上的自动面部表情识别。ITW图像普遍存在姿态变化、视角偏差以及输入分辨率低等实际问题。为此,本文提出一种基于超分辨率的金字塔网络结构(Pyramid with Super-Resolution, PSR),以应对ITW场景下的表情识别挑战。同时,我们引入了一种先验分布标签平滑(Prior Distribution Label Smoothing, PDLS)损失函数,利用表情识别任务中各类表情之间易混淆的先验知识,进一步提升模型的判别能力。在三个最主流的ITW FER数据集上的实验结果表明,所提方法在性能上优于当前所有最先进的技术。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| facial-expression-recognition-on-affectnet | PSR (VGG-16) | Accuracy (7 emotion): - Accuracy (8 emotion): 60.68 |
| facial-expression-recognition-on-raf-db | PSR | Overall Accuracy: 88.98 |