
摘要
我们提出了一种自集成单阶段物体检测器(Self-Ensembling Single-Stage object Detector, SE-SSD),用于在室外点云中实现准确且高效的三维物体检测。我们的主要关注点是在不增加额外推理计算的情况下,利用我们设计的约束条件同时优化模型中的软目标和硬目标。具体而言,SE-SSD 包含一对教师网络和学生网络的单阶段检测器(SSDs),其中我们设计了一种有效的基于交并比(Intersection over Union, IoU)的匹配策略,以从教师网络中筛选出软目标,并制定了一致性损失来使学生网络的预测结果与这些软目标对齐。此外,为了最大化蒸馏知识以集成教师网络,我们设计了一种新的数据增强方案,生成形状感知的增强样本以训练学生网络,旨在鼓励其推断出完整的物体形状。最后,为了更好地利用硬目标,我们设计了 ODIoU 损失来监督学生网络,对其预测的边界框中心和方向施加约束。我们的 SE-SSD 在所有先前发表的作品中取得了最佳性能。此外,在 KITTI 基准测试中,它在鸟瞰图(Bird's Eye View, BEV)和三维排行榜上分别获得了第 1 名和第 2 名的成绩,并且具有超高的推理速度。代码已发布在 https://github.com/Vegeta2020/SE-SSD。
代码仓库
Vegeta2020/SE-SSD
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| 3d-object-detection-on-kitti-cars-easy | SE-SSD | AP: 91.49% |
| 3d-object-detection-on-kitti-cars-hard | SE-SSD | AP: 77.15% |
| birds-eye-view-object-detection-on-kitti-cars | SE-SSD | AP: 91.84% |
| birds-eye-view-object-detection-on-kitti-cars-4 | SE-SSD | AP: 95.68% |
| birds-eye-view-object-detection-on-kitti-cars-5 | SE-SSD | AP: 86.72% |