8 个月前

计算机视觉

计算机视觉

Jeonghwan Kim Mi-Gyeong Gwon Hyunwoo Park Hyukmin Kwon Gi-Mun Um Wonjun Kim

摘要

本文提出了一种简单而强大的方法，用于从单个RGB图像重建三维人体网格。最近的研究中，变换器（Transformer）已经有效地估计了整个网格顶点的非局部相互作用，而图模型也开始处理身体各部分之间的关系。尽管这些方法在三维人体网格重建方面取得了显著进展，但直接推断从二维输入图像编码的特征与每个顶点的三维坐标之间的关系仍然具有挑战性。为了解决这一问题，我们设计了一种简单的特征采样方案。其核心思想是在嵌入空间中根据点的引导进行特征采样，这些点是从三维网格顶点投影得到的结果（即地面真值）。这有助于模型在二维空间中更加关注与顶点相关的特征，从而实现自然的人体姿态重建。此外，我们应用了渐进式注意力掩码技术，即使在严重遮挡的情况下也能精确估计顶点之间的局部相互作用。基准数据集上的实验结果表明，所提出的方法有效提升了三维人体网格重建的性能。代码和模型已在以下网址公开发布：https://github.com/DCVL-3D/PointHMR_release。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Jeonghwan Kim Mi-Gyeong Gwon Hyunwoo Park Hyukmin Kwon Gi-Mun Um Wonjun Kim

摘要

本文提出了一种简单而强大的方法，用于从单个RGB图像重建三维人体网格。最近的研究中，变换器（Transformer）已经有效地估计了整个网格顶点的非局部相互作用，而图模型也开始处理身体各部分之间的关系。尽管这些方法在三维人体网格重建方面取得了显著进展，但直接推断从二维输入图像编码的特征与每个顶点的三维坐标之间的关系仍然具有挑战性。为了解决这一问题，我们设计了一种简单的特征采样方案。其核心思想是在嵌入空间中根据点的引导进行特征采样，这些点是从三维网格顶点投影得到的结果（即地面真值）。这有助于模型在二维空间中更加关注与顶点相关的特征，从而实现自然的人体姿态重建。此外，我们应用了渐进式注意力掩码技术，即使在严重遮挡的情况下也能精确估计顶点之间的局部相互作用。基准数据集上的实验结果表明，所提出的方法有效提升了三维人体网格重建的性能。代码和模型已在以下网址公开发布：https://github.com/DCVL-3D/PointHMR_release。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供