7 个月前

计算机视觉

卷积神经网络

多任务学习

计算机视觉

George Papandreou Tyler Zhu Liang-Chieh Chen Spyros Gidaris Jonathan Tompson Kevin Murphy

摘要

我们提出了一种无框自底向上的方法，用于多人图像中的人体姿态估计和实例分割任务，该方法采用高效的单次模型。所提出的PersonLab模型通过基于部件的建模方法解决了语义级推理和对象部件关联问题。我们的模型使用了一个卷积网络，该网络学会了检测各个关键点并预测它们之间的相对位移，从而使得我们可以将关键点分组为人体姿态实例。此外，我们提出了一种由部件诱导的几何嵌入描述符，这使得我们可以将语义级别的人员像素与其对应的人体实例关联起来，实现实例级别的人员分割。我们的系统基于全卷积架构，允许高效推断，其运行时间基本上与场景中出现的人数无关。仅在COCO数据上训练，我们的系统在单尺度推断下达到了COCO测试开发集的关键点平均精度0.665，在多尺度推断下达到了0.687，显著优于所有先前的自底向上姿态估计系统。我们也是首个在COCO实例分割任务中报告具有竞争力结果的自底向上方法，在人员类别中的平均精度达到了0.417。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

卷积神经网络

多任务学习

计算机视觉

George Papandreou Tyler Zhu Liang-Chieh Chen Spyros Gidaris Jonathan Tompson Kevin Murphy

摘要

我们提出了一种无框自底向上的方法，用于多人图像中的人体姿态估计和实例分割任务，该方法采用高效的单次模型。所提出的PersonLab模型通过基于部件的建模方法解决了语义级推理和对象部件关联问题。我们的模型使用了一个卷积网络，该网络学会了检测各个关键点并预测它们之间的相对位移，从而使得我们可以将关键点分组为人体姿态实例。此外，我们提出了一种由部件诱导的几何嵌入描述符，这使得我们可以将语义级别的人员像素与其对应的人体实例关联起来，实现实例级别的人员分割。我们的系统基于全卷积架构，允许高效推断，其运行时间基本上与场景中出现的人数无关。仅在COCO数据上训练，我们的系统在单尺度推断下达到了COCO测试开发集的关键点平均精度0.665，在多尺度推断下达到了0.687，显著优于所有先前的自底向上姿态估计系统。我们也是首个在COCO实例分割任务中报告具有竞争力结果的自底向上方法，在人员类别中的平均精度达到了0.417。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

PersonLab：基于自底向上、部件级的几何嵌入模型的人体姿态估计和实例分割 | 论文 | HyperAI超神经