3 个月前

DenseRaC:通过密集渲染与对比实现联合3D姿态与形状估计

DenseRaC:通过密集渲染与对比实现联合3D姿态与形状估计

摘要

我们提出了一种名为DenseRaC的新颖端到端框架,用于从单目RGB图像中联合估计三维人体姿态与体形。该框架采用两阶段策略,以身体像素到表面对应关系图(即IUV图)作为代理表示,进而实现参数化人体姿态与体形的估计。具体而言,在获得估计的IUV图后,我们设计了一种深度神经网络,通过优化三维人体重建损失,并引入“渲染-对比”机制,最小化输入图像与渲染输出之间的差异,包括密集的人体关键点、身体部位掩码以及对抗性先验信息。为增强模型学习能力,我们进一步构建了一个大规模合成数据集MOCA,该数据集基于网络爬取的动捕序列、三维扫描数据与动画生成,涵盖多样化的相机视角、人体动作及体形特征,并配有完整的真值标注。我们的模型能够从混合数据集中联合学习三维人体的表示,有效缓解了训练数据未配对的问题。实验结果表明,DenseRaC在多个公开的人体相关任务基准测试中均显著优于现有最先进方法。

基准测试

基准方法指标
3d-human-pose-estimation-on-human36mDenseRaC
Average MPJPE (mm): 76.8
PA-MPJPE: 48
3d-human-pose-estimation-on-mpi-inf-3dhpDenseRaC
AUC: 41.1
MPJPE: 114.2
PCK: 76.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DenseRaC:通过密集渲染与对比实现联合3D姿态与形状估计 | 论文 | HyperAI超神经