3 个月前

MSR-GCN:用于人体运动预测的多尺度残差图卷积网络

MSR-GCN:用于人体运动预测的多尺度残差图卷积网络

摘要

人体动作预测是一项具有挑战性的任务,主要源于未来姿态的随机性与非周期性。近年来,图卷积网络(Graph Convolutional Network, GCN)已被证明在捕捉关节之间动态关系方面非常有效,从而有助于提升姿态预测的准确性。另一方面,人体姿态可被递归抽象为多尺度的表示形式:随着抽象层次的提升,姿态的运动趋势趋于更加稳定,这同样有利于姿态预测。本文提出一种新型的端到端多尺度残差图卷积网络(Multi-Scale Residual Graph Convolution Network, MSR-GCN),用于人体姿态预测任务。该网络首先从细粒度到粗粒度提取特征,再从粗粒度到细粒度进行特征重构,各尺度下提取的特征被融合后用于解码输入姿态与目标姿态之间的残差。此外,在所有预测姿态上引入中间监督机制,促使网络学习更具代表性的特征表示。我们在两个标准基准数据集——Human3.6M数据集与CMU Mocap数据集上对所提方法进行了评估。实验结果表明,该方法在性能上优于当前最先进的技术。代码与预训练模型已公开,详见:https://github.com/Droliven/MSRGCN。

代码仓库

Droliven/MSRGCN
官方
pytorch

基准测试

基准方法指标
human-pose-forecasting-on-human36mMSR-GCN
Average MPJPE (mm) @ 1000 ms: 114.2
Average MPJPE (mm) @ 400ms: 62.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MSR-GCN:用于人体运动预测的多尺度残差图卷积网络 | 论文 | HyperAI超神经