4 个月前

M3D-RPN:单目三维区域提议网络用于目标检测

M3D-RPN:单目三维区域提议网络用于目标检测

摘要

理解三维世界是城市自动驾驶的关键组成部分。通常情况下,昂贵的激光雷达(LiDAR)传感器与立体RGB成像的结合对于成功的三维目标检测算法至关重要,而仅依赖单目图像的方法则性能大幅下降。我们提出通过将单目三维检测问题重新表述为独立的三维区域提议网络来缩小这一差距。我们利用了二维和三维视角之间的几何关系,使得三维框能够利用在图像空间中生成的已知且强大的卷积特征。为了帮助解决复杂的三维参数估计问题,我们进一步设计了深度感知卷积层,这些层能够实现位置特定的特征开发,从而提高对三维场景的理解能力。与以往的单目三维检测工作相比,我们的方法仅包含所提出的三维区域提议网络,而不依赖外部网络、数据或多个阶段。M3D-RPN能够在KITTI城市自动驾驶数据集中显著提升单目三维目标检测和俯视图任务的性能,同时高效地使用共享多类模型。

代码仓库

JuliaChae/M3D-RPN-Waymo
GitHub 中提及
Nicholasli1995/EgoNet
pytorch
GitHub 中提及
garrickbrazil/M3D-RPN
官方
pytorch
GitHub 中提及
abhi1kumar/M3D-RPN
pytorch
GitHub 中提及

基准测试

基准方法指标
3d-object-detection-from-monocular-images-on-6M3D-RPN
3D mAPH Vehicle (Front Camera Only): 0.65
3d-object-detection-on-rope3dM3D-RPN+(G)
AP@0.7: 16.75
monocular-3d-object-detection-on-kitti-carsM3D-RPN
AP Medium: 9.71
vehicle-pose-estimation-on-kitti-cars-hardM3D-RPN
Average Orientation Similarity: 67.08

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
M3D-RPN:单目三维区域提议网络用于目标检测 | 论文 | HyperAI超神经