
摘要
近年来,机器人技术和增强现实领域中涌现出一系列具有前景的应用,推动了点云数据中三维物体检测的广泛关注。本文提出了一种开创性的全卷积无锚框室内三维物体检测方法——FCAF3D。该方法结构简洁而高效,采用体素(voxel)表示点云数据,并利用稀疏卷积对体素进行处理,仅需一次全卷积前向传播即可高效处理大规模场景,运行时延极低。现有三维物体检测方法通常对物体几何结构做出先验假设,我们指出此类假设限制了模型的泛化能力。为摆脱任何先验假设,本文提出一种新颖的定向边界框参数化方式,实现了完全基于数据驱动的性能提升。实验结果表明,该方法在ScanNet V2(mAP@0.5提升4.5)、SUN RGB-D(提升3.5)和S3DIS(提升20.5)三个基准数据集上均取得了当前最优的检测性能。相关代码与模型已开源,地址为:https://github.com/samsunglabs/fcaf3d。
代码仓库
bosszhe/vimi
pytorch
GitHub 中提及
open-mmlab/mmdetection3d
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-object-detection-on-3rscan | FCAF3D | mAP@0.25: 60.1 mAP@0.5: 42.6 |
| 3d-object-detection-on-multiscan | FCAF3D | mAP@0.25: 53.8 mAP@0.5: 40.7 |
| 3d-object-detection-on-s3dis | FCAF3D | mAP@0.25: 66.7 mAP@0.5: 45.9 |
| 3d-object-detection-on-scannet-1 | FCAF3D | mAP@0.25: 22.3 mAP@0.5: 11.4 |
| 3d-object-detection-on-scannetv2 | FCAF3D | mAP@0.25: 71.5 mAP@0.5: 57.3 |
| 3d-object-detection-on-sun-rgbd-val | FCAF3D (Geo only) | mAP@0.25: 64.2 mAP@0.5: 48.9 |