
摘要
利用基于LiDAR的检测器或真实的LiDAR点云数据来引导单目3D检测,已带来显著性能提升,例如伪LiDAR(Pseudo-LiDAR)方法。然而,现有方法通常采用非端到端的训练策略,且对LiDAR信息的利用不够充分,导致LiDAR数据所蕴含的丰富潜力未能得到充分挖掘。为此,本文提出一种跨模态知识蒸馏(Cross-Modality Knowledge Distillation, CMKD)网络,用于单目3D检测,能够高效且直接地将LiDAR模态的知识在特征层面和响应层面迁移至图像模态。此外,我们进一步将CMKD扩展为一种半监督训练框架,通过从大规模无标签数据中蒸馏知识,显著提升检测性能。截至投稿时,CMKD在KITTI测试集和Waymo验证集上的单目3D检测任务中均位列第一,相较于此前的最先进方法,取得了显著的性能提升。
代码仓库
Cc-Hy/CMKD
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| monocular-3d-object-detection-on-kitti-1 | CMKD | AP Hard: 7.42 |
| monocular-3d-object-detection-on-kitti-3 | CMKD | AP Easy: 13.94 |
| monocular-3d-object-detection-on-kitti-4 | CMKD | AP Medium: 8.79 |
| monocular-3d-object-detection-on-kitti-5 | CMKD | AP Easy: 12.52 |
| monocular-3d-object-detection-on-kitti-6 | CMKD | AP Medium: 6.67 |
| monocular-3d-object-detection-on-kitti-7 | CMKD | AP Hard: 6.34 |
| monocular-3d-object-detection-on-kitti-cars-1 | CMKD | AP Hard: 16.77 |
| monocular-3d-object-detection-on-kitti-cars-2 | CMKD | AP Easy: 28.55 |