
摘要
尽管卷积神经网络(CNNs)在二维人体姿态估计方面已经取得了成功,但三维人体姿态估计尚未得到充分研究。本文通过端到端学习方法使用CNNs解决三维人体姿态估计问题。我们利用CNNs学习一个关节与其他关节之间的相对三维位置。所提出的方法通过两个创新点改进了CNN的性能。首先,我们将二维姿态信息与图像特征拼接,以从图像中估计三维姿态。其次,我们发现通过结合多个关节的相对位置信息,而不是仅依赖一个根关节的信息,可以获得更准确的三维姿态。实验结果表明,所提出的方法在Human 3.6M数据集上的表现与现有最先进方法相当。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-human-pose-estimation-on-human36m | CNN Lifter | Average MPJPE (mm): 117.34 |