
摘要
基于热力图的回归方法克服了直接坐标回归在空间信息与上下文信息上的不足,彻底革新了人脸对齐任务。然而,该方法在图像缩放和网络下采样过程中忽略了亚像素坐标,导致显著的量化误差。本文首次在基准数据集上对量化误差进行了定量分析,发现其占当前最先进方法总预测误差的三分之一以上。为解决该问题,本文提出一种新颖的“热力图嵌套热力图”(Heatmap In Heatmap, HIH)表示方法,以及坐标软分类(Coordinate Soft-Classification, CSC)机制,并将其无缝集成至经典的hourglass网络架构中。HIH表示通过嵌套的双热力图联合建模坐标标签:其中“整数热力图”用于表示坐标的整数部分,而“小数热力图”则用于表示亚像素部分,其覆盖范围恰好对应于整数热力图中一个像素的区域。此外,本文将偏移回归问题转化为区间分类任务,CSC方法将像素的置信度视为其所属区间的概率。同时,CSC采用分布损失(distribution loss),利用高斯分布函数生成的软标签来指导偏移热力图的训练,从而更有效地学习坐标偏移的分布特性。在多个具有挑战性的基准数据集上的大量实验表明,所提出的HIH方法能够取得当前最优的性能。特别地,在WFLW数据集上,HIH达到4.08的归一化均值误差(NME),在COFW数据集上达到3.21的NME,显著优于此前所有方法。
代码仓库
starhiking/HeatmapInHeatmap
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-300w | HIH | NME_inter-ocular (%, Challenge): 4.89 NME_inter-ocular (%, Common): 2.65 NME_inter-ocular (%, Full): 3.09 |
| face-alignment-on-cofw | HIH | NME (inter-ocular): 3.21% |
| face-alignment-on-wflw | HIH | AUC@10 (inter-ocular): 60.5 FR@10 (inter-ocular): 2.60 NME (inter-ocular): 4.08 |
| face-alignment-on-wfw-extra-data | HIH | AUC@10 (inter-ocular): 60.50 FR@10 (inter-ocular): 2.60 NME (inter-ocular): 4.08 |