
摘要
近期,基于深度学习的面部关键点检测取得了显著进展。然而,语义模糊问题降低了检测性能。具体而言,语义模糊导致注释不一致,并对模型的收敛产生负面影响,从而导致精度下降和预测不稳定。为了解决这一问题,我们提出了一种自适应模糊减少(Self-adapTive Ambiguity Reduction, STAR)损失函数,通过利用语义模糊的特性来设计该函数。我们发现,语义模糊会导致预测分布的各向异性,这启发我们使用预测分布来表示语义模糊。基于此,我们设计了STAR损失函数,用于衡量预测分布的各向异性程度。与标准回归损失相比,当预测分布呈现各向异性时,STAR损失被鼓励减小,从而自适应地减轻语义模糊的影响。此外,我们提出了两种特征值限制方法,可以避免分布异常变化和模型过早收敛。最后,全面的实验结果表明,在COFW、300W和WFLW三个基准数据集上,STAR损失在几乎不增加计算开销的情况下优于现有最先进方法。代码位于 https://github.com/ZhenglinZhou/STAR。
代码仓库
zhenglinzhou/star
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-300w | STAR | NME_inter-ocular (%, Challenge): 4.32 NME_inter-ocular (%, Common): 2.52 NME_inter-ocular (%, Full): 2.87 NME_inter-pupil (%, Challenge): 6.22 NME_inter-pupil (%, Common): 3.5 NME_inter-pupil (%, Full): 4.03 |
| face-alignment-on-cofw | STAR | NME (inter-ocular): 3.21% NME (inter-pupil): 4.62 |
| face-alignment-on-wflw | STAR | AUC@10 (inter-ocular): 60.5 FR@10 (inter-ocular): 2.32 NME (inter-ocular): 4.02 |