
摘要
近年来,人体检测取得了令人瞩目的进展。然而,在高度拥挤环境中检测人体的遮挡问题仍远未解决。更为不利的是,当前的人体检测基准测试中对人群场景的代表性仍然不足。在本文中,我们介绍了一个新的数据集,称为CrowdHuman,以更好地评估在人群场景中的检测器性能。CrowdHuman数据集规模庞大、注释丰富且具有高度多样性。训练和验证子集中共有约47万个(470K)人体实例,每张图像平均包含约22.6个人体,数据集中存在各种类型的遮挡情况。每个个体实例均标注了头部边界框、可见区域边界框和全身边界框。本文展示了最先进的检测框架在CrowdHuman数据集上的基线性能。CrowdHuman数据集的跨数据集泛化结果表明,在无需额外技巧的情况下,该数据集在Caltech-USA、CityPersons和Brainwash等先前的数据集上实现了最先进的性能。我们希望我们的数据集能够作为坚实的基线,并有助于推动未来在人体检测任务方面的研究。
代码仓库
aibeedetect/bfjdet
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-crowdhuman-full-body | Faster RCNN (ResNet50) | AP: 84.95 mMR: 50.49 |
| pedestrian-detection-on-caltech | FRCNN+FPN-Res50+refined feature map+Crowdhuman | Reasonable Miss Rate: 3.46 |
| pedestrian-detection-on-citypersons | FRCNN+FPN-Res50+refined feature map+Crowdhuman | Reasonable MR^-2: 10.67 |