
摘要
传统的集成方法通常基于独立训练且去相关化的模型构建,已被证明能够有效降低剩余的泛化误差,从而在实际应用中实现稳健且精确的性能。然而,在深度学习背景下,训练深度神经网络的集成模型成本高昂,且存在显著的冗余,导致效率低下。本文基于卷积神经网络,对共享表示的集成方法(Ensembles with Shared Representations, ESRs)进行了实验研究,从定性和定量两个层面验证了其在处理大规模面部表情数据集时的数据处理效率与可扩展性。研究结果表明,通过调整ESR的分支层级,在不损失模型多样性与泛化能力的前提下,可显著降低冗余与计算负荷,而这两者均是保障集成方法性能的关键因素。在大规模数据集上的实验表明,ESRs能够有效减少AffectNet与FER+数据集上的剩余泛化误差,达到人类水平的识别性能,并在基于情感与情绪概念的野外面部表情识别任务中,超越现有最先进方法。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| facial-expression-recognition-on-affectnet | Ensemble with Shared Representations (ESR-9) | Accuracy (7 emotion): - Accuracy (8 emotion): 59.3 |
| facial-expression-recognition-on-fer-1 | Ensemble with Shared Representations (ESR-9) | Accuracy: 87.15 |