4 个月前

峰值引导的深度网络用于面部表情识别

峰值引导的深度网络用于面部表情识别

摘要

用于面部相关识别任务(如面部表情识别(FER))的深度网络训练目标函数通常独立考虑每个样本。在本研究中,我们提出了一种新颖的峰值引导深度网络(PPDN),该网络利用同一主体的峰值表情样本(易样本)来监督相同类型但非峰值表情样本(难样本)的中间特征响应。通过这种方式,从非峰值表情到峰值表情的演变过程可以隐式地嵌入网络中,以实现对表情强度的不变性。为了进行网络训练,我们提出了一种特殊目的的反向传播程序——峰值梯度抑制(PGS)。该方法促使非峰值表情样本在中间层的特征响应向对应的峰值表情样本靠拢,同时避免了相反的情况发生。这防止了由于非峰值表情样本的干扰而导致峰值表情样本识别能力下降的问题。在两个流行的FER数据集Oulu-CASIA和CK+上的广泛对比实验表明,PPDN优于现有的最先进的FER方法,并且展示了其在网络结构和优化策略方面的优势。此外,实验结果还证明了PPDN是一种通用架构,通过适当定义峰值和非峰值样本,可以扩展到其他任务。这一点在使用Multi-PIE数据集进行姿态不变人脸识别的任务中得到了验证,实验显示其性能达到了现有最先进水平。

基准测试

基准方法指标
facial-expression-recognition-on-oulu-casiaPPDN
Accuracy (10-fold): 84.59

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
峰值引导的深度网络用于面部表情识别 | 论文 | HyperAI超神经