3 个月前

用于多人姿态估计的精细局部表征学习

用于多人姿态估计的精细局部表征学习

摘要

本文提出了一种名为残差步长网络(Residual Steps Network, RSN)的新方法。RSN 通过高效聚合具有相同空间尺寸的特征(即同层级特征,Intra-level features),获得精细的局部表征,从而保留丰富的低层空间信息,实现精准的关键点定位。此外,我们观察到输出特征对最终性能的贡献程度各不相同。为解决这一问题,我们设计了一种高效的注意力机制——姿态精炼机(Pose Refine Machine, PRM),在输出特征中权衡局部与全局表征,进一步优化关键点位置。本方法在 COCO 关键点挑战赛 2019 中获得第一名,并在 COCO 与 MPII 两个基准测试上均取得了当前最优(state-of-the-art)的结果,且无需使用额外训练数据或预训练模型。单模型在 COCO test-dev 上达到 78.6 的 AP 值,在 MPII 测试集上达到 93.0 的准确率;集成模型在 COCO test-dev 上达到 79.2,在 COCO test-challenge 数据集上达到 77.1。相关源代码已公开,可供后续研究使用,地址为:https://github.com/caiyuanhao1998/RSN/。

代码仓库

chenyilun95/tf-cpn
tf
GitHub 中提及
caiyuanhao1998/RSN
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
keypoint-detection-on-coco4xRSN-50(384×288)
Test AP: 78.6
keypoint-detection-on-coco-test-challenge4×RSN-50
AP: 77.1
AP50: 93.3
AP75: 83.6
APL: 82.6
AR: 82.6
AR50: 96.1
AR75: 88.2
ARL: 88.7
ARM: 78.0
multi-person-pose-estimation-on-cocoRSN
AP: 0.792
pose-estimation-on-coco-test-dev4xRSN-50
AP: 78.6
AP50: 94.3
AP75: 86.6
APL: 75.5
APM: 83.3
AR: 83.8
pose-estimation-on-coco-test-dev4xRSN-50 (ensemble)
AP: 79.2
AP50: 94.4
AP75: 87.1
APL: 76.1
APM: 83.8
AR: 84.1
pose-estimation-on-mpii-human-pose4xRSN-50
PCKh-0.5: 93.0
pose-estimation-on-mpii-single-person4xRSN-50
PCKh@0.5: 93

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于多人姿态估计的精细局部表征学习 | 论文 | HyperAI超神经