4 个月前

基于截锥体的VoxNet用于从RGB-D或深度图像中检测3D物体

基于截锥体的VoxNet用于从RGB-D或深度图像中检测3D物体

摘要

近期,出现了大量基于RGB图像和3D图像的分类和检测系统。在本研究中,我们描述了一种新的从RGB-D或仅深度点云中进行3D物体检测的系统。该系统首先在2D图像(无论是RGB图像还是从深度数据构建的伪RGB图像)中检测物体。接下来,在这些2D检测定义的3D视锥内检测3D物体。这是通过将视锥的部分区域体素化来实现的(因为视锥可能非常大),而不是像早期工作那样使用整个视锥。我们的系统的最大创新之处在于确定哪些部分(3D候选区域)需要体素化,从而能够在感兴趣物体周围提供高分辨率表示。这还使得我们的系统具有较低的内存需求。这些3D候选区域被输入到一个高效的基于ResNet的3D全卷积网络(FCN)中。我们的3D检测系统速度快,可以集成到机器人平台中。与不进行体素化的系统(如PointNet)相比,我们的方法无需对数据集进行下采样即可运行。我们还引入了一种流水线方法,进一步提高了系统的效率。在SUN RGB-D数据集上的实验结果表明,基于小型网络的我们的系统可以以每秒20帧的速度处理数据,其检测结果与现有最先进方法相当,并且实现了两倍的速度提升。

基准测试

基准方法指标
3d-object-detection-on-sun-rgbd-valFrustum VoxNet (+3D ResNetFCN6)
Inference Speed (s): 0.16
mAP@0.25: 37.7
3d-object-detection-on-sun-rgbd-valFrustum VoxNet (YOLO v3+3D ResNetFCN6)
Inference Speed (s): 0.048
object-detection-in-indoor-scenes-on-sun-rgbFrustum VoxNet (Depth only)
AP 0.5: 42.8
object-detection-in-indoor-scenes-on-sun-rgbFrustum VoxNet (RGB)
AP 0.5: 47.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于截锥体的VoxNet用于从RGB-D或深度图像中检测3D物体 | 论文 | HyperAI超神经