
摘要
姿态预测是指根据先前的一段姿态窗口来预测未来的姿态。在本文中,我们提出了一种新的问题,即利用3D关节坐标序列来预测姿态。与传统的基于动作捕捉(Mocap)帧的姿态预测不同,该问题由于其简单的传感器数据采集方式,在实际应用中更为便捷。我们还提出了一种新的框架,PISEP^2(基于伪图像序列演化的3D姿态预测),以解决这一新问题。具体而言,我们通过将关节坐标序列转换为图像序列提出了一个骨骼表示方法,该方法可以建模不同关节之间的不同相关性。借助这种基于图像的骨骼表示,我们将姿态预测建模为图像序列的演化过程。此外,我们提出了一种新颖的推理网络,通过非递归方式解耦解码器,一步预测所有未来姿态。与递归的序列到序列模型相比,我们的方法可以显著提高计算效率并避免误差累积。我们在两个基准数据集(如G3D和FNTU)上进行了广泛的实验。实验结果表明,所提出的算法在这两个数据集上均达到了最先进的性能,证明了我们方法的有效性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| pose-prediction-on-filtered-ntu-rgbd | PISEP^2 (L2) | MAE: 1.4063 MSE: 0.1354 |
| pose-prediction-on-filtered-ntu-rgbd | PISEP^2 (L1 norm) | MAE: 1.1651 MSE: 0.1210 |
| pose-prediction-on-gaming-3d-g3d | PISEP^2 (L1 norm) | MAE: 1.1101 MSE: 0.1199 |
| pose-prediction-on-gaming-3d-g3d | PISEP^2 (L2) | MAE: 1.4038 MSE: 0.1434 |