3 个月前

WHenet:面向宽范围头部姿态的实时细粒度估计

WHenet:面向宽范围头部姿态的实时细粒度估计

摘要

我们提出了一种端到端的头部姿态估计网络,能够仅通过单张RGB图像,对全范围的头部偏航角(yaw)进行欧拉角预测。现有方法在正面视角下表现良好,但极少针对所有视角的头部姿态进行建模。该方法在自动驾驶与零售等领域具有广泛应用前景。我们的网络基于多损失策略,对损失函数及训练策略进行了改进,以适应大范围头部姿态估计的需求。此外,我们首次从当前的全景分割数据集中提取了前视图的真实标签(ground truth labelings)。由此构建的宽范围头部姿态估计网络(Wide Headpose Estimation Network, WHENet)是首个适用于全范围头部偏航角(即“宽范围”)的细粒度现代方法,同时在正面头部姿态估计任务上达到或超越现有最先进水平。该网络结构紧凑、计算高效,适用于移动设备及实际应用场景。

基准测试

基准方法指标
head-pose-estimation-on-aflw2000WHENet-V
MAE: 4.83
head-pose-estimation-on-aflw2000WHENet
MAE: 5.42
head-pose-estimation-on-biwiWHENet
MAE (trained with other data): 3.81
head-pose-estimation-on-biwiWHENet-V
MAE (trained with other data): 3.48
head-pose-estimation-on-panopticWHENET
Geodesic Error (GE): 24.38

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
WHenet:面向宽范围头部姿态的实时细粒度估计 | 论文 | HyperAI超神经