
摘要
我们探讨了空间上下文信息在人体姿态估计中的重要性。大多数最先进的姿态网络采用多阶段训练方法,并生成多个辅助预测以实现深度监督。基于这一原则,我们提出两种概念简单且计算高效的模块,即级联预测融合(Cascade Prediction Fusion, CPF)和姿态图神经网络(Pose Graph Neural Network, PGNN),以利用潜在的上下文信息。级联预测融合通过累积前几个阶段的预测图来提取有用信号,这些图还作为先验信息指导后续阶段的预测。为了增强关节之间的空间相关性,我们的PGNN学习将人体姿态表示为一个图结构,从而实现不同关节之间的直接消息传递并捕捉空间关系。这两种模块所需的计算复杂度非常低。实验结果表明,我们的方法在MPII和LSP基准测试中持续优于先前的方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| pose-estimation-on-mpii-human-pose | Spatial Context | PCKh-0.5: 92.5 |