3 个月前

用于野生环境下面部表情识别的金字塔结构与超分辨率结合方法

用于野生环境下面部表情识别的金字塔结构与超分辨率结合方法

摘要

面部表情识别(Facial Expression Recognition, FER)是一项具有挑战性的任务,有助于提升人机交互的自然性。本文聚焦于单张“野生”(in-the-wild, ITW)图像上的自动面部表情识别。ITW图像普遍存在姿态变化、视角偏差以及输入分辨率低等实际问题。为此,本文提出一种基于超分辨率的金字塔网络结构(Pyramid with Super-Resolution, PSR),以应对ITW场景下的表情识别挑战。同时,我们引入了一种先验分布标签平滑(Prior Distribution Label Smoothing, PDLS)损失函数,利用表情识别任务中各类表情之间易混淆的先验知识,进一步提升模型的判别能力。在三个最主流的ITW FER数据集上的实验结果表明,所提方法在性能上优于当前所有最先进的技术。

基准测试

基准方法指标
facial-expression-recognition-on-affectnetPSR (VGG-16)
Accuracy (7 emotion): -
Accuracy (8 emotion): 60.68
facial-expression-recognition-on-raf-dbPSR
Overall Accuracy: 88.98

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于野生环境下面部表情识别的金字塔结构与超分辨率结合方法 | 论文 | HyperAI超神经