
摘要
热图回归在地标定位中已应用了相当长的时间。大多数方法使用非常深的瓶颈模块堆栈进行热图分类阶段,随后通过热图回归提取关键点。本文提出了一种单一的树突状卷积神经网络(Dendritic CNN),称为姿态条件树突状卷积神经网络(Pose Conditioned Dendritic Convolutional Neural Network, PCD-CNN)。该网络由一个分类网络和一个后续的模块化分类网络组成,整个模型以端到端的方式训练,以获得准确的地标点。基于贝叶斯公式,我们显式地解耦人脸图像的3D姿态,通过在姿态条件下进行地标估计,使其与多任务方法有所不同。广泛的实验表明,通过姿态条件化可以减少定位误差,使其对人脸姿态不敏感。所提出的模型可以扩展以生成不同数量的地标点,从而拓宽其在其他数据集中的适用性。我们没有增加网络的深度或宽度,而是通过Mask-Softmax损失和难例挖掘高效地训练CNN,在包括AFLW、AFW、COFW和IBUG在内的具有挑战性的数据集中,对于极端和中等姿态的人脸图像,相比现有最先进方法实现了高达15%的误差减少。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-cofw | PCD-CNNCVPR 18 | NME (inter-ocular): 5.77% |