3 个月前

多任务野外头姿估计

多任务野外头姿估计

摘要

我们提出了一种基于深度学习的多任务方法,用于图像中头部姿态的估计。本文贡献了一个网络架构与训练策略,充分利用了面部姿态、对齐与可见性之间的强相关性,从而在三个任务上均实现了卓越的性能。所提出的架构采用带有残差块和横向跳跃连接的编码器-解码器卷积神经网络(CNN)。实验表明,将头部姿态估计与基于关键点的面部对齐任务相结合,显著提升了姿态估计的性能。此外,将姿态估计任务置于编码器末端的瓶颈层,而将依赖空间信息的任务(如可见性与对齐)置于解码器末端的最终层,也有助于进一步提升整体性能。在实验中,所提出的模型在面部姿态估计与可见性判断任务上均优于当前最先进的方法。通过引入最后一步的关键点回归,该模型在面部对齐任务上的表现也达到了与当前最先进方法相当的水平。

代码仓库

基准测试

基准方法指标
face-alignment-on-aflw2000MNN+ORB (Reannotated)
Error rate: 2.58
face-alignment-on-aflw2000-3dMNN+OR (reannotated)
Balanced NME (2D Sparse Alignment): 2.58%
face-alignment-on-cofwMNN (Inter-pupil Norm)
NME (inter-pupil): 5.65%
face-alignment-on-cofwMNN+OR (Inter-pupils Norm)
NME (inter-pupil): 5.04%
Recall at 80% precision (Landmarks Visibility): 72.12
head-pose-estimation-on-aflwMNN
MAE: 3.22
head-pose-estimation-on-aflw2000MNN
MAE: 3.83
head-pose-estimation-on-biwiMNN
MAE (trained with other data): 3.66
pose-estimation-on-300w-fullMNN
MAE mean (º): 1.56

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多任务野外头姿估计 | 论文 | HyperAI超神经