
摘要
行人检测中的一个关键问题是检测小尺度目标,这些目标在图像和视频中会引入微弱的对比度和运动模糊,我们认为这在一定程度上是由根深蒂固的标注偏差造成的。基于此动机,我们提出了一种结合体拓扑线定位(TLL)和时间特征聚合的新方法,用于检测多尺度行人,该方法特别适用于距离摄像头较远的小尺度行人。此外,我们引入了一种基于马尔可夫随机场(MRF)的后处理方案,以消除遮挡情况下的模糊性。通过综合应用这些方法,我们在Caltech基准数据集上取得了最佳的检测性能,并显著提高了小尺度目标的检测效果(漏检率从74.53%降至60.79%)。除此之外,我们在CityPersons数据集上也取得了具有竞争力的性能,并展示了KITTI数据集中存在标注偏差的现象。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| pedestrian-detection-on-citypersons | TLL+MRF | Bare MR^-2: 9.2 Heavy MR^-2: 52.0 Partial MR^-2: 15.9 Reasonable MR^-2: 14.4 |
| pedestrian-detection-on-citypersons | TLL | Bare MR^-2: 10.0 Heavy MR^-2: 53.6 Partial MR^-2: 17.2 Reasonable MR^-2: 15.5 |