3 个月前

基于学习坐标回归器的级联编码器-解码器CNN用于鲁棒性人脸关键点检测

基于学习坐标回归器的级联编码器-解码器CNN用于鲁棒性人脸关键点检测

摘要

卷积神经网络(CNN)已成为解决众多计算机视觉问题的基准技术。尽管用于面部关键点检测的CNN具有较强的鲁棒性,但在处理非受限条件下获取的图像时,其精度仍显不足。本文提出一种级联神经网络回归器的方法,以提升面部关键点估计的准确性。具体而言,我们采用两个结构相同的编码器-解码器CNN进行级联:第一个网络生成一组热图,提供关键点位置的粗略估计;第二个网络则通过合成遮挡数据进行训练,用于精化存在歧义或被遮挡的关键点位置。最后,通过一个全连接层(各热图间共享权重),对关键点坐标进行高精度回归。实验结果表明,该方法在300W、COFW和WFLW三个广泛认为最具挑战性的公开数据集上均达到了当前最优水平。

基准测试

基准方法指标
face-alignment-on-300wCHR2C
NME_inter-ocular (%, Challenge): 5.15
NME_inter-ocular (%, Common): 2.85
NME_inter-ocular (%, Full): 3.3
NME_inter-pupil (%, Challenge): 7.44
NME_inter-pupil (%, Common): 3.96
NME_inter-pupil (%, Full): 4.64
face-alignment-on-cofwCHR2C (Inter-pupils Norm)
NME (inter-pupil): 5.09%
face-alignment-on-wflwCHR2C
AUC@10 (inter-ocular): 57.55
FR@10 (inter-ocular): 3.55
NME (inter-ocular): 4.39
facial-landmark-detection-on-300wCHR2C (Inter-ocular Norm)
NME: 3.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于学习坐标回归器的级联编码器-解码器CNN用于鲁棒性人脸关键点检测 | 论文 | HyperAI超神经