
摘要
从图像中估计三维人体通常会产生不合理的姿态,例如身体倾斜、漂浮或穿透地面。这类方法忽视了一个关键事实:人体通常受到场景的支撑。虽然物理引擎可用于强制实现物理上的合理性,但其不可微分,依赖于不现实的代理人体模型,且难以融入现有的优化与学习框架中。相比之下,我们提出了一种新颖的直观物理(Intuitive Physics, IP)项,这些项可从三维SMPL人体模型与场景的交互中推断得出。受生物力学启发,我们推断出人体上的压力热力图、由热力图计算得到的压力中心(Center of Pressure, CoP),以及SMPL人体模型的质心(Center of Mass, CoM)。基于这些物理量,我们提出了IPMAN方法,通过鼓励合理的地面接触以及CoP与CoM的重合,从彩色图像中估计出处于“稳定”状态的三维人体。所提出的IP项具有直观性、易于实现、计算高效、可微分,并能无缝集成到现有的优化与回归方法中。我们在标准数据集以及新构建的MoYo数据集上对IPMAN进行了评估,该数据集包含同步多视角图像、具有复杂姿态的真实三维人体、人体-地面接触信息、质心与压力分布等标注。实验结果表明,IPMAN在静态姿态估计上显著优于现有最先进方法,同时在动态姿态估计上保持了不劣的表现。相关代码与数据已公开,供研究使用:https://ipman.is.tue.mpg.de。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-human-pose-estimation-on-human36m | IPMAN-R | Average MPJPE (mm): 60.6 PA-MPJPE: 41.8 |
| 3d-human-pose-estimation-on-rich | IPMAN-R | BoSE: 71.2% MPJPE: 79 MPVPE: 89.9 PA-MPJPE: 47.6 |