
摘要
现有的基于深度学习的人脸关键点检测方法已取得优异性能。然而,这些方法并未显式建模关键点之间的结构依赖关系,因此难以保持关键点间的几何约束关系,且在复杂场景或未见数据上的泛化能力有限。本文提出一种基于深度卷积网络与条件随机场(Conditional Random Field, CRF)相结合的深度结构化人脸关键点检测方法。实验结果表明,该方法在人脸关键点检测任务中显著优于现有最先进技术,尤其在包含大姿态变化和遮挡等挑战性数据集上展现出更优的泛化能力。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-300w | CNN-CRF | NME_inter-ocular (%, Challenge): 4.84 NME_inter-ocular (%, Common): 2.93 NME_inter-ocular (%, Full): 3.30 NME_inter-pupil (%, Challenge): 6.98 NME_inter-pupil (%, Common): 4.06 NME_inter-pupil (%, Full): 4.63 |
| facial-landmark-detection-on-300w | CNN-CRF (Inter-ocular Norm) | NME: 3.30 |