
摘要
贪心非极大值抑制(Greedy-NMS)本身存在一个固有的权衡困境:较低的NMS阈值可能导致召回率下降,而较高的阈值则会引入更多误检。这一问题在行人检测任务中尤为突出,因为行人间的实例密度变化更为剧烈。然而,以往关于NMS的研究大多未充分考虑或仅模糊地考虑了邻近行人存在的影响因素。为此,我们提出了一种名为“邻近物体幻觉生成器”(Nearby Objects Hallucinator, NOH)的新方法,该方法通过高斯分布精确建模每个候选框周围可能存在的邻近物体。同时,我们进一步设计了NOH-NMS,该方法能够根据空间区域中存在其他物体的高概率,动态地减轻对该区域的抑制强度。与传统的Greedy-NMS相比,我们的方法作为当前最先进的技术,在CrowdHuman数据集上分别将平均精度(AP)提升至89.0%,召回率(Recall)提升至92.9%,以及误检率指标$\text{MR}^{-2}$降低至43.9%,相较之前方法分别实现了3.9%、5.1%和0.8%的显著提升。
代码仓库
TencentYoutuResearch/PedestrianDetection-NohNMS
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-crowdhuman-full-body | NOH-NMS | AP: 89.0 mMR: 43.9 |
| pedestrian-detection-on-citypersons | NOH-NMS | Bare MR^-2: 6.6 Heavy MR^-2: 53.0 Partial MR^-2: 11.2 Reasonable MR^-2: 10.8 |