4 个月前

端到端的人体形状和姿态恢复

端到端的人体形状和姿态恢复

摘要

我们介绍了人体网格恢复(Human Mesh Recovery, HMR),这是一种从单张RGB图像中重建完整3D人体网格的端到端框架。与大多数当前仅计算2D或3D关节位置的方法不同,我们生成了一种更为丰富且实用的网格表示,该表示由形状和3D关节角度参数化。主要目标是最小化关键点的重投影损失,这使得我们的模型可以使用只有真实2D注释的野外图像进行训练。然而,仅靠重投影损失会使模型高度欠约束。在本研究中,我们通过引入一个对抗网络来解决这一问题,该网络利用大量3D人体网格数据库判断一个人体参数是否真实。我们展示了HMR可以在有无配对的2D到3D监督的情况下进行训练。我们不依赖于中间的2D关键点检测,而是直接从图像像素中推断出3D姿态和形状参数。给定包含人的边界框时,我们的模型可以实时运行。我们在各种野外图像上验证了我们的方法,并在输出3D网格的任务上优于之前的基于优化的方法,在如3D关节位置估计和部件分割等任务上也显示出具有竞争力的结果。

代码仓库

基准测试

基准方法指标
3d-human-pose-estimation-on-3dpwHMR
Acceleration Error: 37.4
MPJPE: 130.0
3d-human-pose-estimation-on-agoraHMR
B-MPJPE: 180.5
B-MVE: 173.6
B-NMJE: 226.0
B-NMVE: 217.0
3d-human-pose-estimation-on-human36mHMR
Average MPJPE (mm): 87.97
PA-MPJPE: 58.1
3d-human-pose-estimation-on-mpi-inf-3dhpHMR
AUC: 36.5
MPJPE: 124.2
PA-MPJPE: 89.8
PCK: 72.9
3d-human-shape-estimation-on-ssp-3dHMR
PVE-T-SC: 22.9
mIOU: 69.0
3d-human-shape-estimation-on-ssp-3dHMR(unpaired)
PVE-T-SC: 20.8
mIOU: 61.0
3d-multi-person-pose-estimation-on-agoraHMR
B-MPJPE: 180.5
B-MVE: 173.6
B-NMJE: 226.0
B-NMVE: 217.0
monocular-3d-human-pose-estimation-on-human3HMR
Frames Needed: 1
Need Ground Truth 2D Pose: No
Use Video Sequence: No
multi-hypotheses-3d-human-pose-estimation-on-2HMR
Best-Hypothesis MPJPE (n = 25): -
Best-Hypothesis PMPJPE (n = 25): -
H36M PMPJPE (n = 1): 56.8
H36M PMPJPE (n = 25): 56.8
Most-Likely Hypothesis PMPJPE (n = 1): -
multi-hypotheses-3d-human-pose-estimation-on-2HMR (2D Vis, by MHEntropy)
Best-Hypothesis MPJPE (n = 25): -
Best-Hypothesis PMPJPE (n = 25): 85.2
H36M PMPJPE (n = 1): 67.4
H36M PMPJPE (n = 25): 67.4
Most-Likely Hypothesis PMPJPE (n = 1): 85.2
weakly-supervised-3d-human-pose-estimation-onKanzawa et al.
3D Annotations: No

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供