
摘要
近年来,热图回归方法在面部对齐领域占据主导地位,但它们忽略了不同标志点之间的内在关系。本文提出了一种稀疏局部补丁变换器(Sparse Local Patch Transformer, SLPT)来学习这种内在关系。SLPT从局部补丁中生成每个单独标志点的表示,并通过基于注意力机制的自适应内在关系进行聚合。每个标志点的亚像素坐标根据聚合后的特征独立预测。此外,还引入了一种由粗到精的框架与SLPT结合使用,该框架利用动态调整大小的局部补丁提供的细粒度特征,使初始标志点逐步收敛到目标面部标志点。我们在三个流行的基准数据集上进行了大量实验,包括WFLW、300W和COFW,结果表明所提出的方法在计算复杂度显著降低的情况下达到了最先进的水平,通过学习面部标志点之间的内在关系实现了这一效果。项目网站提供了代码。
代码仓库
jiahao-uts/slpt-master
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| face-alignment-on-300w | SLPT | NME_inter-ocular (%, Challenge): 4.90 NME_inter-ocular (%, Common): 2.75 NME_inter-ocular (%, Full): 3.17 |
| face-alignment-on-cofw | SLPT | NME (inter-ocular): 3.32 NME (inter-pupil): 4.79 |
| face-alignment-on-cofw-68 | SPLT | NME (inter-ocular): 4.10 |
| face-alignment-on-wflw | SLPT | AUC@10 (inter-ocular): 59.5 FR@10 (inter-ocular): 2.76 NME (inter-ocular): 4.14 |
| face-alignment-on-wfw-extra-data | SPLT | AUC@10 (inter-ocular): 59.50 FR@10 (inter-ocular): 2.76 NME (inter-ocular): 4.14 |