4 个月前

从RGB-D图像中学习丰富的特征以进行物体检测和分割

从RGB-D图像中学习丰富的特征以进行物体检测和分割

摘要

本文研究了RGB-D图像中物体检测的问题,利用语义丰富的图像和深度特征进行检测。我们提出了一种新的地心嵌入方法(geocentric embedding)用于深度图像,该方法不仅编码每个像素相对于地面的高度和与重力的角度,还包含了水平视差。实验结果表明,这种地心嵌入方法在使用卷积神经网络学习特征表示时优于原始深度图像。我们的最终物体检测系统达到了37.3%的平均精度,相比现有方法相对提高了56%。接下来,我们将重点放在实例分割任务上,即对检测器找到的物体实例所属的像素进行标记。为此,我们提出了一种决策森林方法(decision forest approach),通过一系列一元和二元测试查询形状和地心姿态特征,将检测窗口中的像素分类为前景或背景。最后,我们将物体检测器的输出应用于现有的超像素分类框架中进行语义场景分割,并在我们研究的物体类别上实现了比当前最先进方法高24%的相对改进。我们认为,本文所代表的这些进展将有助于促进感知技术在机器人等领域中的应用。

代码仓库

基准测试

基准方法指标
object-detection-in-indoor-scenes-on-sun-rgbRGB-D RCNN (RGB + Depth)
AP 0.5: 44.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
从RGB-D图像中学习丰富的特征以进行物体检测和分割 | 论文 | HyperAI超神经