3 个月前

LCR-Net:用于人体姿态估计的定位-分类-回归

LCR-Net:用于人体姿态估计的定位-分类-回归

摘要

我们提出了一种用于自然图像中联合2D与3D人体姿态估计的端到端架构。本方法的核心在于为每张图像生成并评分多个姿态候选方案,从而实现对多个人体的2D与3D姿态的同步预测。因此,该方法无需预先对人体位置进行近似定位即可完成初始化。所提出的网络架构名为LCR-Net,包含三个主要组成部分:1)姿态候选生成器,用于在图像不同位置提出潜在的姿态;2)分类器,用于对不同的姿态候选进行打分;3)回归器,用于在2D和3D空间中对姿态候选进行精细化调整。这三个阶段共享卷积特征层,并采用联合训练的方式。最终的姿态估计结果通过融合邻近的姿态假设获得,实验表明该方法优于传统的非极大值抑制(non-maximum suppression)算法。在受控环境下的Human3.6M数据集上,该方法在3D姿态估计任务中显著超越了当前最优水平;同时,在MPII 2D姿态基准数据集的真实图像场景中,无论针对单人还是多人子集,均取得了具有前景的性能表现。

基准测试

基准方法指标
3d-human-pose-estimation-on-human36mLCR-Net
Average MPJPE (mm): 87.7
PA-MPJPE: 71.6
3d-multi-person-pose-estimation-root-relativeLCR-Net
MPJPE: 146

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
LCR-Net:用于人体姿态估计的定位-分类-回归 | 论文 | HyperAI超神经