3 个月前

三维图像结构的再思考:多人姿态估计

三维图像结构的再思考:多人姿态估计

摘要

我们研究从多视角图像中进行多人三维姿态估计的问题。由于状态空间显著扩大、存在遮挡现象,以及在未知人体身份的情况下跨视角存在歧义,从单人姿态估计扩展到多人姿态估计,从二维空间扩展到三维空间,面临巨大挑战。为应对这些难题,我们首先通过各相机视角中由人体部件检测器获取的对应部件对进行三角化,从而构建一个简化的状态空间。为解决三角化后可能出现的部件误配、混杂(如不同人体部件错配)以及误检带来的歧义问题,我们提出一种三维图形结构模型(3D Pictorial Structures, 3DPS)。该模型基于多视角的单体势函数(unary potentials),并将先验模型融入成对势函数(pairwise potentials)和三体势函数(ternary potentials)中。为平衡各类势函数的影响,模型参数通过结构化支持向量机(Structured SVM, SSVM)进行学习。该模型具有通用性,既适用于单人也适用于多人姿态估计。为评估模型在单人与多人姿态估计任务上的性能,我们采用四个不同的数据集进行实验。首先分析各类势函数的贡献,随后将实验结果与现有相关方法进行对比,结果表明本方法在性能上具有显著优势。

基准测试

基准方法指标
3d-multi-person-pose-estimation-on-campusBelagiannis model v.3
PCP3D: 84.5
3d-multi-person-pose-estimation-on-shelfBelagiannis model v.3
PCP3D: 77.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
三维图像结构的再思考:多人姿态估计 | 论文 | HyperAI超神经