
摘要
本文解决了人体运动预测的问题,即从历史观察序列中预测未来的身体姿态。尽管现有的最先进方法取得了良好的结果,但它们依赖于任意复杂的深度学习架构,如循环神经网络(RNN)、变压器(Transformers)或图卷积网络(GCN),通常需要多个训练阶段并且参数量超过200万。在本文中,我们展示了通过结合一系列标准实践,例如应用离散余弦变换(DCT)、预测关节的残差位移以及将速度作为辅助损失进行优化,基于多层感知机(MLP)的轻量级网络仅需14万个参数即可超越最先进性能。我们在Human3.6M、AMASS和3DPW数据集上进行了详尽的评估,结果显示我们的方法——命名为siMLPe——始终优于其他所有方法。我们希望这一简单的方法能够为社区提供一个强大的基线,并促使重新思考人体运动预测问题。代码已公开发布于\url{https://github.com/dulucas/siMLPe}。
代码仓库
dulucas/simlpe
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| human-pose-forecasting-on-3dpw | siMLPe | Average MPJPE (mm) 1000 msec: 72.2 |
| human-pose-forecasting-on-amass | siMLPe | Average MPJPE (mm) 1000 msec: 65.7 |
| human-pose-forecasting-on-expi-common-actions | siMLPe | Average MPJPE (mm) @ 200 ms: 80 |
| human-pose-forecasting-on-harper | SiMLPe | Average MPJPE (mm) @ 1000ms: 141 Average MPJPE (mm) @ 400ms: 60 Last Frame MPJPE (mm) @ 1000ms: 264 Last Frame MPJPE (mm) @ 400ms: 98 |
| human-pose-forecasting-on-human36m | siMLPe | Average MPJPE (mm) @ 1000 ms: 109.4 Average MPJPE (mm) @ 400ms: 57.3 |
| multi-person-pose-forecasting-on-expi-common | siMLPe | Average MPJPE (mm) @ 1000 ms: 250 Average MPJPE (mm) @ 400 ms: 128 Average MPJPE (mm) @ 600 ms: 178 |
| multi-person-pose-forecasting-on-expi-unseen | siMLPe | Average MPJPE (mm) @ 400 ms: 131 Average MPJPE (mm) @ 600 ms: 183 Average MPJPE (mm) @ 800 ms: 225 |