4 个月前

面向准确的面部标志检测的级联变换器方法

面向准确的面部标志检测的级联变换器方法

摘要

准确的人脸关键点是许多与人脸相关任务的重要前提。本文提出了一种基于级联变压器(transformers)的高精度人脸关键点检测器。我们将人脸关键点检测任务公式化为坐标回归任务,从而使模型可以进行端到端训练。通过变压器中的自注意力机制(self-attention),我们的模型能够内在地利用关键点之间的结构关系,这在大姿态变化和遮挡等挑战条件下有助于提高关键点检测的准确性。在级联精炼过程中,我们的模型能够基于可变形注意力机制(deformable attention mechanism)提取目标关键点周围的最相关图像特征,从而实现更精确的对齐。此外,我们提出了一种新颖的解码器,能够在同时精炼图像特征和关键点位置的情况下进一步提升检测性能,而参数增加较少。我们的模型在多个标准的人脸关键点检测基准上达到了新的最先进水平,并在跨数据集评估中表现出良好的泛化能力。

基准测试

基准方法指标
face-alignment-on-300wDTLD+
NME_inter-ocular (%, Challenge): 4.48
NME_inter-ocular (%, Common): 2.6
NME_inter-ocular (%, Full): 2.96
face-alignment-on-300w-split-2DTLD-s
AUC@7 (box): 70.9
NME (box): 2.05
face-alignment-on-aflw-19DTLD+
NME_diag (%, Full): 1.37
face-alignment-on-cofwDTLD+
NME (inter-ocular): 3.02%
face-alignment-on-wflwDTLD+
FR@10 (inter-ocular): 2.68
NME (inter-ocular): 4.05

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向准确的面部标志检测的级联变换器方法 | 论文 | HyperAI超神经