
摘要
多人姿态估计是许多计算机视觉任务的基础,在近年来取得了显著进展。然而,以往的大多数方法并未深入探讨拥挤场景中的姿态估计问题,而这一问题在许多实际应用场景中既具有挑战性又不可避免。此外,当前的基准数据集无法为这类情况提供适当的评估。本文提出了一种新颖且高效的方法来解决拥挤场景中的姿态估计问题,并引入了一个新的数据集以更好地评估相关算法。我们的模型包含两个关键组件:关节候选单人姿态估计(SPPE)和全局最大关节关联。通过每个关节的多峰值预测以及基于图模型的全局关联,该方法能够在拥挤场景中有效应对不可避免的干扰,并且在推理过程中非常高效。所提出的方法在CrowdPose数据集上超越了现有最先进方法5.2个mAP点,同时在MSCOCO数据集上的实验结果也证明了该方法的良好泛化能力。我们将公开发布源代码和数据集。
代码仓库
open-mmlab/mmpose
pytorch
jeffffffli/CrowdPose
pytorch
GitHub 中提及
Jeff-sjtu/CrowdPose
pytorch
GitHub 中提及
laowang666888/ECSP1
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| multi-person-pose-estimation-on-crowdpose | Joint-candidate SPPE + | AP Easy: 75.5 AP Hard: 57.4 AP Medium: 66.3 FPS: 10.1 mAP @0.5:0.95: 66.0 |
| multi-person-pose-estimation-on-ochuman | CrowdPose | AP50: 40.8 AP75: 29.9 Validation AP: 27.5 |