4 个月前

鼻子、眼睛和耳朵:通过定位面部关键点进行头部姿态估计

鼻子、眼睛和耳朵:通过定位面部关键点进行头部姿态估计

摘要

单目头部姿态估计需要学习一个模型,该模型能够从输入的人脸图像中计算出姿态的内在欧拉角(偏航角、俯仰角、滚转角)。为野外环境中的图像标注真实的头部姿态角度是一项困难的任务,通常需要使用特定的拟合程序(这些程序只能提供粗略且近似的标注)。这突显了对能够在受控环境中训练并在野外图像上泛化的算法的需求(这些图像具有不同的面部外观和光照条件)。当前大多数直接在输入图像上学习回归函数的深度学习方法都无法实现这一目标。为此,我们提出使用更高层次的表示来通过深度学习架构回归头部姿态。具体而言,我们利用五个面部关键点(左耳、右耳、左眼、右眼和鼻子)上的二维软定位热图作为不确定性图,并将其传递给卷积神经网络以回归头部姿态。我们在两个具有挑战性的基准数据集BIWI和AFLW上展示了头部姿态估计的结果,我们的方法在这两个数据集上均超过了现有最先进的技术。

代码仓库

基准测试

基准方法指标
head-pose-estimation-on-aflwMLP + Location
MAE: 5.14
head-pose-estimation-on-aflwCNN + Heatmap
MAE: 4.06

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
鼻子、眼睛和耳朵:通过定位面部关键点进行头部姿态估计 | 论文 | HyperAI超神经