
摘要
面部情绪识别(Facial Emotion Recognition, FER)在人机交互领域具有重要意义,广泛应用于临床诊疗与行为分析等场景。由于人脸的个体差异性以及图像中存在姿态变化、光照条件不同等复杂因素,计算机实现准确且鲁棒的面部情绪识别仍面临巨大挑战。在各类FER技术中,深度学习模型,尤其是卷积神经网络(Convolutional Neural Networks, CNNs),因其强大的自动特征提取能力与高效的计算性能,展现出巨大潜力。本研究在FER2013数据集上实现了单网络模型的最高分类准确率。我们采用VGGNet网络架构,对模型超参数进行严格调优,并对比实验了多种优化方法。据我们所知,该模型在未使用额外训练数据的前提下,达到了73.28%的单网络最高准确率,达到了当前先进水平。
代码仓库
usef-kh/fer
官方
pytorch
GitHub 中提及
bakerv/fer-webcam
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| facial-expression-recognition-on-fer2013 | VGGNet | Accuracy: 73.28 |