4 个月前

多尺度结构感知网络用于人体姿态估计

多尺度结构感知网络用于人体姿态估计

摘要

我们开发了一种鲁棒的多尺度结构感知神经网络,用于人体姿态估计。该方法在近期的深度卷积-反卷积沙漏模型基础上进行了四项关键改进:(1)多尺度监督,通过跨尺度融合特征热图来加强上下文特征学习,以匹配身体关键点;(2)在末尾添加多尺度回归网络,全局优化多尺度特征的结构匹配;(3)中间监督和回归过程中使用的结构感知损失,提高关键点及其邻近点的匹配精度,从而推断出更高阶的匹配配置;(4)一种关键点掩码训练方案,能够有效微调我们的网络,通过相邻匹配来稳健地定位被遮挡的关键点。我们的方法可以显著改善现有最先进的姿态估计方法在处理不同尺度、遮挡和复杂多人场景时遇到的困难。这种多尺度监督与回归网络紧密集成,能够有效地(i)利用多尺度特征集合来定位关键点,并(ii)通过最大化多个关键点和尺度之间的结构一致性来推断全局姿态配置。关键点掩码训练进一步增强了这些优势,使学习过程更加专注于难以处理的遮挡样本。我们的方法在MPII挑战赛排行榜上处于领先地位,超越了其他最先进的方法。

基准测试

基准方法指标
pose-estimation-on-mpii-human-poseMulti-Scale Structure-Aware Network
PCKh-0.5: 92.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多尺度结构感知网络用于人体姿态估计 | 论文 | HyperAI超神经