4 个月前

HybrIK-X:用于全身网格恢复的混合解析-神经逆运动学方法

HybrIK-X:用于全身网格恢复的混合解析-神经逆运动学方法

摘要

通过从视觉内容中推断抽象的姿态和形状参数来恢复全身网格,可以获得具有真实结构的3D人体模型。然而,推断过程高度非线性,并且存在图像与网格对齐不良的问题,导致重建结果不准确。相比之下,3D关键点估计方法利用体积表示来实现像素级精度,但可能会预测出不真实的体态结构。为了解决这些问题,本文提出了一种新颖的混合逆向运动学解决方案——HybrIK,该方案在一个统一的框架中整合了3D关键点估计和身体网格恢复的优点。HybrIK通过扭转-摆动分解直接将精确的3D关节转换为身体部位旋转。摆动旋转通过解析方法根据3D关节求解,而扭转旋转则通过神经网络从视觉线索中导出。为了捕捉全面的全身细节,我们进一步开发了一个整体框架——HybrIK-X,该框架在HybrIK的基础上增加了可活动的手部和富有表现力的脸部。HybrIK-X通过一个单阶段模型解决全身姿态问题,实现了快速而准确的效果。实验表明,HybrIK和HybrIK-X不仅保留了3D关节的准确性,还保持了参数化人体模型的真实结构,从而实现了像素对齐的全身网格恢复。所提出的方法在各种基准测试中显著超越了现有方法,在仅涉及身体、仅涉及手部以及全身场景下均表现出色。代码和结果可在 https://jeffli.site/HybrIK-X/ 获取。

代码仓库

jeffffffli/HybrIK
pytorch
GitHub 中提及
Jeff-sjtu/HybrIK
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-human-pose-estimation-on-3dpwHybrIK (HRNet-W48)
MPJPE: 71.6
MPVPE: 82.3
PA-MPJPE: 41.8
3d-human-pose-estimation-on-agoraHybrIK
B-MPJPE: 77
B-MVE: 73.9
B-NMJE: 84.6
B-NMVE: 81.2
3d-human-pose-estimation-on-agoraHybrIK-X
B-MPJPE: 67.2
B-MVE: 68.5
B-NMJE: 72.3
B-NMVE: 73.7
3d-human-pose-estimation-on-human36mHybrIK (HRNet-W48)
Average MPJPE (mm): 47
PA-MPJPE: 29.8
3d-human-pose-estimation-on-mpi-inf-3dhpHybrIK (HRNet-W48)
AUC: 47.3
MPJPE: 91
PCK: 87.1
3d-human-reconstruction-on-agora-1HybrIK-X
FB-MPJPE: 107.6
FB-MVE: 112.1
FB-NMJE: 115.7
FB-NMVE: 120.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
HybrIK-X:用于全身网格恢复的混合解析-神经逆运动学方法 | 论文 | HyperAI超神经