
摘要
头部姿态估计是从人类面部计算内在欧拉角(偏航角、俯仰角、滚转角)的关键技术,对于视线估计、面部对齐和三维重建具有重要意义。传统方法严重依赖于面部特征点的准确性,这限制了它们在面部可见条件不佳时的性能。本文提出了一种无需使用面部特征点进行估计的方法,通过将粗略回归输出和精细回归输出结合到深度网络中实现。利用更多的量化单位来表示角度,借助其他辅助粗略单位训练了一个精细分类器。最终预测结果通过整合回归获得。所提出的这种方法在三个具有挑战性的基准数据集上进行了评估,在AFLW2000和BIWI数据集上达到了最先进的水平,并在AFLW数据集上表现良好。代码已发布在Github上。
代码仓库
haofanwang/accurate-head-pose
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| head-pose-estimation-on-aflw | Hybrid Coarse-Fine | MAE: 5.09 |
| head-pose-estimation-on-aflw2000 | Hybrid Coarse-Fine | MAE: 5.395 |
| head-pose-estimation-on-biwi | Hybrid Coarse-Fine | MAE (trained with BIWI data): 3.0174 |