4 个月前

基于信标焦点增强的面部标志检测

基于信标焦点增强的面部标志检测

摘要

深度学习方法在面部关键点检测(FLD)任务中取得了显著的性能提升。然而,在具有挑战性的环境中,如头部姿态变化、夸张表情或不均匀光照条件下,检测关键点仍然是一项难题,这主要是由于高变异性及样本不足所致。这种不足可以归因于模型无法从输入图像中有效获取适当的脸部结构信息。为了解决这一问题,我们提出了一种专门为FLD任务设计的新型图像增强技术,以提高模型对脸部结构的理解能力。为了有效利用新提出的增强技术,我们采用基于Siamese架构的训练机制,并结合基于深度规范相关分析(DCCA)的损失函数,实现从输入图像的两个不同视角中集体学习高层次特征表示。此外,我们还采用了Transformer + CNN架构的网络,并引入了自定义沙漏模块作为Siamese框架的强大骨干。大量实验表明,我们的方法在多个基准数据集上优于多种最先进的方法。

基准测试

基准方法指标
face-alignment-on-300wFiFA
NME_inter-ocular (%, Challenge): 4.47
NME_inter-ocular (%, Common): 2.51
NME_inter-ocular (%, Full): 2.89
face-alignment-on-aflw-19FiFA
AUC_box@0.07 (%, Full): 81.8
NME_box (%, Full): 1.31
NME_diag (%, Frontal): 0.80
NME_diag (%, Full): 0.92
face-alignment-on-cofwFiFA
NME (inter-ocular): 2.96
face-alignment-on-wflwFiFA
AUC@10 (inter-ocular): 61.78
FR@10 (inter-ocular): 1.60
NME (inter-ocular): 3.89
facial-landmark-detection-on-300wFiFA
NME: 2.89
facial-landmark-detection-on-aflw-frontFiFA
Mean NME: 0.80
Mean NME : 0.80
NME: 0.80
facial-landmark-detection-on-aflw-fullFiFA
Mean NME: 0.92
Mean NME : 0.92
NME: 0.92
facial-landmark-detection-on-cofwFiFA
NME: 2.96
NME (inter-ocular): 2.96
facial-landmark-detection-on-wflw-1FiFA
AUC@10 (inter-ocular): 61.78
FR@10 (inter-ocular): 1.60
NME (inter-ocular): 3.89

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于信标焦点增强的面部标志检测 | 论文 | HyperAI超神经