4 个月前

学习用于单目3D目标检测的深度引导卷积

学习用于单目3D目标检测的深度引导卷积

摘要

从单张图像中进行3D物体检测而不使用激光雷达(LiDAR)是一项具有挑战性的任务,因为缺乏精确的深度信息。传统的2D卷积不适合此任务,因为它们无法捕捉到局部物体及其尺度信息,而这些信息对于3D物体检测至关重要。为了更好地表示3D结构,以往的方法通常将从2D图像估计的深度图转换为伪激光雷达表示,然后应用现有的基于3D点云的物体检测器。然而,这些方法的结果严重依赖于估计深度图的准确性,导致性能次优。在本研究中,我们没有使用伪激光雷达表示,而是通过提出一种新的局部卷积网络(LCN),即深度引导的动态深度扩张LCN(Depth-guided Dynamic-Depthwise-Dilated LCN, D$^4$LCN),改进了基本的2D全卷积网络。在该网络中,滤波器及其感受野可以从基于图像的深度图中自动学习,使得不同图像中的不同像素具有不同的滤波器。D$^4$LCN克服了传统2D卷积的局限性,并缩小了图像表示与3D点云表示之间的差距。大量实验表明,D$^4$LCN在多个指标上显著优于现有方法。例如,在KITTI数据集的中等难度设置下,相对于最先进的方法,D$^4$LCN的相对提升达到了9.1%。代码已发布在https://github.com/dingmyu/D4LCN。

代码仓库

dingmyu/D4LCN
官方
pytorch
Chenzixi1/D4LCNpaddle
paddle
GitHub 中提及

基准测试

基准方法指标
monocular-3d-object-detection-on-kitti-carsD4LCN
AP Medium: 11.72
vehicle-pose-estimation-on-kitti-cars-hardD4LCN
Average Orientation Similarity: 63.98

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
学习用于单目3D目标检测的深度引导卷积 | 论文 | HyperAI超神经