
摘要
行人检测是计算机视觉中的一个关键问题,对城市自动驾驶的安全具有重要影响。在本研究中,我们探讨了如何利用语义分割来提高行人检测的准确性,同时对网络效率的影响微乎其微。我们提出了一种分割注入网络,以实现语义分割和行人检测的联合监督。当放置得当时,额外的监督有助于引导共享层中的特征变得更加复杂且有利于下游的行人检测器。通过这种方法,我们发现弱标注框足以带来显著的性能提升。我们进行了深入分析,展示了分割监督如何塑造共享层。结果表明,生成的特征图在语义上更具意义,并且对形状变化和遮挡更加鲁棒。总体而言,我们的同步检测和分割框架在Caltech行人数据集上取得了显著优于现有方法的成绩,在KITTI数据集上也表现出竞争力,并且执行速度比竞争方法快两倍。
代码仓库
garrickbrazil/SDS-RCNN
GitHub 中提及
Ricardozzf/sdsrcnn
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| pedestrian-detection-on-caltech | SDS-RCNN | Reasonable Miss Rate: 7.36 |