7 个月前

机器视觉 3D

卷积神经网络

计算机视觉

He Wang Srinath Sridhar Jingwei Huang Julien Valentin Shuran Song Leonidas J. Guibas

摘要

本文的目标是在RGB-D图像中估计未见过的物体实例的6D姿态和尺寸。与“实例级”6D姿态估计任务不同，我们的问题假设在训练或测试过程中均无精确的物体CAD模型可用。为了处理给定类别中的不同和未见过的物体实例，我们引入了归一化物体坐标空间（Normalized Object Coordinate Space, NOCS）——这是一种为类别内所有可能的物体实例提供共享规范表示的方法。随后，我们的基于区域的神经网络被训练以直接从观测像素推断出与这种共享物体表示（NOCS）及其他物体信息（如类别标签和实例掩码）之间的对应关系。这些预测可以与深度图结合，共同估计杂乱场景中多个物体的度量6D姿态和尺寸。为了训练我们的网络，我们提出了一种新的上下文感知技术来生成大量完全注释的混合现实数据。为进一步改进模型并评估其在真实数据上的性能，我们还提供了一个具有大环境和实例变化的真实世界数据集，并对其进行了完全注释。大量的实验表明，所提出的方法能够在真实环境中稳健地估计未见过的物体实例的姿态和尺寸，同时在标准6D姿态估计基准上也达到了最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

机器视觉 3D

卷积神经网络

计算机视觉

He Wang Srinath Sridhar Jingwei Huang Julien Valentin Shuran Song Leonidas J. Guibas

摘要

本文的目标是在RGB-D图像中估计未见过的物体实例的6D姿态和尺寸。与“实例级”6D姿态估计任务不同，我们的问题假设在训练或测试过程中均无精确的物体CAD模型可用。为了处理给定类别中的不同和未见过的物体实例，我们引入了归一化物体坐标空间（Normalized Object Coordinate Space, NOCS）——这是一种为类别内所有可能的物体实例提供共享规范表示的方法。随后，我们的基于区域的神经网络被训练以直接从观测像素推断出与这种共享物体表示（NOCS）及其他物体信息（如类别标签和实例掩码）之间的对应关系。这些预测可以与深度图结合，共同估计杂乱场景中多个物体的度量6D姿态和尺寸。为了训练我们的网络，我们提出了一种新的上下文感知技术来生成大量完全注释的混合现实数据。为进一步改进模型并评估其在真实数据上的性能，我们还提供了一个具有大环境和实例变化的真实世界数据集，并对其进行了完全注释。大量的实验表明，所提出的方法能够在真实环境中稳健地估计未见过的物体实例的姿态和尺寸，同时在标准6D姿态估计基准上也达到了最先进的性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供