
摘要
面部重建与跟踪是增强现实(AR)、虚拟现实(VR)、人机交互以及医疗应用等领域的重要基础技术。在这些应用中,尤其是当重建的面部被置于具有度量基准的场景中(例如存在已知尺寸的参考物体)时,对形状进行度量准确的预测尤为关键。此外,任何需要测量面部距离与尺寸的应用(如虚拟试戴眼镜框)也依赖于度量重建。当前最先进的单图像面部重建方法通常在大规模二维图像数据集上采用自监督方式训练。然而,由于透视投影的固有特性,这些方法无法恢复真实的面部尺寸;事实上,在度量准确性方面,仅预测平均人脸尺寸的表现反而优于部分先进方法。为了学习真实的面部形状,我们主张采用监督式训练策略。由于目前尚无适用于该任务的大规模三维数据集,我们对多个小规模和中等规模的数据集进行了标注与统一整合。尽管整合后的数据集已达到中等规模(包含超过2000个个体),但若仅基于此数据集进行训练,仍存在严重的过拟合风险。为此,我们利用在大规模二维图像数据集上预训练的面部识别网络,该网络能够为不同个体生成具有区分性的特征,并对表情、光照及摄像机变化具有较强的鲁棒性。我们借助这些特征,以监督方式训练面部形状估计器,从而继承面部识别网络所具备的鲁棒性与泛化能力。我们提出的方法名为MICA(MetrIC fAce),在当前非度量基准以及我们构建的度量基准上均显著优于现有最先进方法。在NoW基准测试中,MICA分别实现了15%和24%的平均误差降低,充分验证了其在度量重建方面的优越性能。
代码仓库
Zielon/MICA
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-face-reconstruction-on-now-benchmark-1 | MICA | Mean Reconstruction Error (mm): 1.11 Median Reconstruction Error: 0.90 Stdev Reconstruction Error (mm): 0.92 |
| 3d-face-reconstruction-on-realy | MICA | @cheek: 1.099 (±0.324) @forehead: 2.374 (±0.683) @mouth: 3.478 (±1.204) @nose: 1.585 (±0.325) all: 2.134 |
| 3d-face-reconstruction-on-realy-side-view | MICA | @cheek: 1.109 (±0.325) @forehead: 2.379 (±0.675) @mouth: 3.567 (±1.212) @nose: 1.525 (±0.322) all: 2.145 |