4 个月前

PoseAug:一种可微分的三维人体姿态增强框架

PoseAug:一种可微分的三维人体姿态增强框架

摘要

现有的3D人体姿态估计器在新数据集上的泛化性能较差,这主要是由于训练数据中2D-3D姿态对的多样性有限所致。为了解决这一问题,我们提出了PoseAug,这是一种新的自动增强框架,旨在通过增加训练姿态的多样性来提高训练后的2D到3D姿态估计器的泛化能力。具体而言,PoseAug引入了一种新颖的姿态增强器,该增强器通过可微操作学习调整姿态的各种几何因素(例如姿势、身体大小、视角和位置)。凭借这种可微能力,增强器可以与3D姿态估计器联合优化,并以估计误差作为反馈,在线生成更多样且更具挑战性的姿态。此外,PoseAug还引入了一种新的局部关节角度合理性评估方法——部分感知的动力链空间(Part-aware Kinematic Chain Space),并据此开发了一个判别模块,以确保增强后姿态的合理性。这些精心设计的功能使得PoseAug能够生成比现有离线增强方法更加多样且合理的姿态,从而提高了姿态估计器的泛化能力。PoseAug具有通用性和易于应用的特点,适用于各种3D姿态估计器。大量实验表明,PoseAug在同场景和跨场景数据集上均带来了显著的改进。特别是在跨数据集评估设置下,在MPI-INF-3DHP数据集上实现了88.6%的3D PCK指标,相比之前最佳的数据增强方法提升了9.1%。代码可在以下地址获取:https://github.com/jfzhang95/PoseAug。

代码仓库

jfzhang95/PoseAug
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-human-pose-estimation-on-3dpwHR-Net+ST-GCN+PoseAug
PA-MPJPE: 73.2
3d-human-pose-estimation-on-human36mHR-Net+ST-GCN+PoseAug
Average MPJPE (mm): 50.8
Multi-View or Monocular: Monocular
Using 2D ground-truth joints: No
3d-human-pose-estimation-on-human36m2DGT+VPose+PoseAug (GTi)
Average MPJPE (mm): 38.2
Multi-View or Monocular: Monocular
Using 2D ground-truth joints: Yes
3d-human-pose-estimation-on-human36m2DGT+ST-GCN+PoseAug (GTi)
Average MPJPE (mm): 36.9
Multi-View or Monocular: Monocular
Using 2D ground-truth joints: Yes
3d-human-pose-estimation-on-human36mHR-Net+VPose+PoseAug
Average MPJPE (mm): 50.2
Multi-View or Monocular: Monocular
Using 2D ground-truth joints: No
3d-human-pose-estimation-on-mpi-inf-3dhpPoseAug (+Extra2D)
AUC: 57.9
MPJPE: 71.1
PCK: 89.2
3d-human-pose-estimation-on-mpi-inf-3dhpHR-Net+ST-GCN+PoseAug
MPJPE: 76.6
3d-human-pose-estimation-on-mpi-inf-3dhpVPose+PoseAug
AUC: 57.3
MPJPE: 73
PCK: 88.6
3d-human-pose-estimation-on-mpi-inf-3dhpHR-Net+VPose+PoseAug
MPJPE: 73.2
monocular-3d-human-pose-estimation-on-human3HR-Net+VPose+PoseAug
Average MPJPE (mm): 50.2
PA-MPJPE: 39.1
monocular-3d-human-pose-estimation-on-human3PoseAug
Frames Needed: 1
Need Ground Truth 2D Pose: No
Use Video Sequence: No
weakly-supervised-3d-human-pose-estimation-onPoseAug
3D Annotations: S1
Average MPJPE (mm): 56.7
Number of Frames Per View: 1
Number of Views: 1
weakly-supervised-3d-human-pose-estimation-onPoseAug
3D Annotations: S1
Number of Frames Per View: 1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
PoseAug:一种可微分的三维人体姿态增强框架 | 论文 | HyperAI超神经