4 个月前

Pix3D:单图像三维形状建模的数据集和方法

Pix3D:单图像三维形状建模的数据集和方法

摘要

我们在单张图像的三维形状建模领域进行了研究,并在三个方面做出了贡献。首先,我们提出了Pix3D,这是一个大规模的基准数据集,包含多样化的图像-形状对及其像素级别的2D-3D对齐。Pix3D在形状相关任务中具有广泛的应用,包括重建、检索、视角估计等。然而,构建这样一个大规模的数据集极具挑战性;现有的数据集要么仅包含合成数据,要么缺乏2D图像与3D形状之间的精确对齐,要么只有少量的图像。其次,我们通过行为研究校准了三维形状重建的评估标准,并利用这些标准在Pix3D上客观系统地评估了前沿的重建算法。最后,我们设计了一种新颖的模型,该模型可以同时进行三维重建和姿态估计;我们的多任务学习方法在这两个任务上均达到了最先进的性能。

代码仓库

基准测试

基准方法指标
3d-shape-reconstruction-on-pix3dMarrNet extension (w/ Pose)
CD: 0.119
EMD: 0.118
IoU: 0.282
3d-shape-retrieval-on-pix3dMarrNet extension (w/o Pose)
R@1: 0.53
R@16: 0.85
R@2: 0.62
R@32: 0.90
R@4: 0.71
R@8: 0.78

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Pix3D:单图像三维形状建模的数据集和方法 | 论文 | HyperAI超神经