4 个月前

Rel3D:一种最小对比度的基准测试,用于在三维空间中定位空间关系

Rel3D:一种最小对比度的基准测试,用于在三维空间中定位空间关系

摘要

理解视觉输入中的空间关系(例如,“笔记本电脑在桌子上”)对人类和机器人来说都非常重要。现有的数据集不足之处在于缺乏大规模、高质量的三维地面真值信息,这对于学习空间关系至关重要。本文通过构建Rel3D填补了这一空白:这是首个大规模、由人类标注的用于三维空间关系定位的数据集。Rel3D使得在大规模人类数据上量化三维信息在预测空间关系方面的有效性成为可能。此外,我们提出了一种最小对比数据收集方法——一种新颖的众包方法,旨在减少数据集偏差。我们数据集中的三维场景以最小对比对的形式出现:一对中的两个场景几乎完全相同,但在一个场景中某个空间关系成立,而在另一个场景中则不成立。我们通过实验证明,最小对比示例可以诊断当前关系检测模型的问题,并且有助于样本高效的训练。代码和数据可在https://github.com/princeton-vl/Rel3D 获取。

代码仓库

princeton-vl/SpatialSense
pytorch
GitHub 中提及
princeton-vl/Rel3D
官方
pytorch
GitHub 中提及

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Rel3D:一种最小对比度的基准测试,用于在三维空间中定位空间关系 | 论文 | HyperAI超神经