3 个月前

FrankMocap:一种基于回归与融合的单目3D全身姿态估计系统

FrankMocap:一种基于回归与融合的单目3D全身姿态估计系统

摘要

现有的大多数单目三维姿态估计方法仅关注人体的某一部分,忽略了人类运动的本质在于面部、双手与躯干之间细微动作的协同表达。本文提出了一种名为FrankMocap的快速且高精度的全身三维姿态估计系统,能够从自然场景下的单张图像中同步生成面部、双手及躯干的三维姿态。FrankMocap的核心思想在于其模块化设计:我们首先独立运行针对面部、双手和躯干的三维姿态回归方法,随后通过一个集成模块将各部分的回归结果进行融合。这种分离的回归模块设计使我们能够充分发挥各子模块在各自任务上的最先进性能,同时在实际应用中不牺牲原有的准确性和可靠性。我们设计了三种不同的集成模块,分别在延迟与精度之间进行权衡。所有模块均能以简洁而有效的方式,将独立输出统一为连贯一致的全身姿态估计结果。通过定量与定性实验,我们验证了所提出的模块化系统在整体性能上显著优于基于优化的方法以及端到端的全身姿态估计方法。

代码仓库

基准测试

基准方法指标
3d-human-pose-estimation-on-3dpwFrankMocap
MPJPE: 94.3
PA-MPJPE: 60
3d-human-reconstruction-on-expressive-hands-1FrankMocap
MPJPE, left hand: 13.2
MPJPE-14: 62.3
PA V2V (mm), body only: 52.7
PA V2V (mm), left hand: 12.8
PA V2V (mm), whole body: 57.5
TR V2V (mm), body only: 80.1
TR V2V (mm), left hand: 32.1
TR V2V (mm), whole body: 76.9
mean P2S: 31.6
median P2S: 19.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
FrankMocap:一种基于回归与融合的单目3D全身姿态估计系统 | 论文 | HyperAI超神经