Abhinav KumarTim K. MarksWenxuan MouYe WangMichael JonesAnoop CherianToshiaki Koike-AkinoXiaoming LiuChen Feng

摘要
现代人脸对齐方法在预测面部关键点位置方面已具备相当高的准确性,但通常无法估计预测位置的不确定性,也无法判断关键点是否可见。本文提出了一种新型框架,可联合预测关键点位置、其对应的不确定性以及关键点的可见性。我们将这些属性建模为混合随机变量,并通过一种基于所提出的“位置、不确定性与可见性似然性”(Location, Uncertainty, and Visibility Likelihood, LUVLi)损失函数训练的深度网络进行估计。此外,我们发布了一个全新的大规模人脸对齐数据集标注版本,包含超过19,000张人脸图像,涵盖了各种姿态的头部朝向。每张人脸均经过人工标注,提供68个关键点的真实位置,并额外标注了每个关键点的可见性状态:是否无遮挡、自遮挡(由极端头部姿态导致)或外部遮挡。实验结果表明,所提出的联合估计方法不仅能够准确预测关键点位置的不确定性,同时在多个标准人脸对齐数据集上也取得了当前最优的定位性能。此外,该方法对预测关键点位置不确定性的估计,可用于自动识别导致人脸对齐失败的输入图像,这对下游任务具有重要意义。
代码仓库
abhi1kumar/LUVLi
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-300w-common | LUVLi | NME: 2.76 |
| face-alignment-on-300w-split-2 | LUVLi | AUC@7 (box): 68.3 NME (box): 2.24 |
| face-alignment-on-300w-split-2-300w-lp | LUVLI | AUC@7 (bbox): 70.2 NME (bbox): 2.10 |
| face-alignment-on-aflw-19 | LUVLi | AUC_box@0.07 (%, Full): 68.0 NME_box (%, Full): 2.28 NME_diag (%, Frontal): 1.19 NME_diag (%, Full): 1.39 |
| face-alignment-on-cofw-68 | LUVLi | AUC@7 (box): 60.8 NME (box): 2.75 |
| face-alignment-on-cofw-68-300wlp | LUVLI | AUC@7: 63.4 NME (box): 2.57 |
| face-alignment-on-menpo | LUVLi | AUC (box): 71.9 NME (box): 2.04 |
| face-alignment-on-merl-rav | LUVLi | AUC@7 (box) : 77.08 NME (box): 1.61 |
| face-alignment-on-wflw | LUVLi | AUC@10 (inter-ocular): 57.7 FR@10 (inter-ocular): 3.12 NME (inter-ocular): 4.37 |
| face-alignment-on-wfw-extra-data | LUVLi | AUC@10 (inter-ocular): 57.7 FR@10 (inter-ocular): 3.12 NME (inter-ocular): 4.37 |