
摘要
在深度学习时代,从未经校准的多摄像头中进行人体姿态估计尚未得到足够的关注。本文展示了如何训练一个神经模型以高精度和最小的延迟开销完成这一任务。所提出的模型考虑了由于多视角遮挡导致的关节位置不确定性,并且仅需2D关键点数据进行训练。我们的方法在广泛使用的Human3.6M数据集上超越了经典的束调整算法和弱监督单目3D基线方法,同时也在更具挑战性的野外Ski-Pose PTZ数据集上表现优异。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-human-pose-estimation-on-human36m | MetaPose (S1+S2) | Average MPJPE (mm): 49 |
| 3d-human-pose-estimation-on-skipose | MetaPose (S1+S2) | MPJPE: 53 P-MPJPE: 42 |
| 3d-human-pose-estimation-on-skipose | MetaPose (S1+IR) | MPJPE: 54 P-MPJPE: 30 |
| weakly-supervised-3d-human-pose-estimation-on | MetaPose (S1+S2/SS) | Average MPJPE (mm): 56 |