3 个月前

可泛化的行人检测:房间里的大象

可泛化的行人检测:房间里的大象

摘要

行人检测广泛应用于各类基于视觉的应用场景,从视频监控到自动驾驶系统。尽管现有检测器在特定数据集上已达到较高性能,但其在未见数据上的泛化能力仍不明确。这一点至关重要,因为实际应用中的检测器需具备在多种场景下直接部署的能力。为此,本文基于“直接跨数据集评估”这一通用原则,开展了一项全面研究。研究发现,尽管当前最先进的行人检测器在同数据集训练与测试下表现优异,但在跨数据集评估中却表现出较差的泛化性能。我们揭示出这一现象背后的两个主要原因:其一,现有检测器的设计(如锚框设置)往往偏向于传统单数据集训练与测试范式中的主流基准,导致其泛化能力受到显著限制;其二,训练数据在行人密度和场景多样性方面普遍不足。令人意外的是,在直接跨数据集评估中,我们发现一种无需针对行人任务进行专门设计的通用目标检测器,其泛化性能显著优于当前最先进的行人检测器。此外,本文进一步表明,通过网络爬取方式构建的多样化且高密度的数据集,可作为行人检测任务高效预训练的优质数据源。基于此,我们提出了一种渐进式训练流程,并验证其在面向自动驾驶的行人检测任务中具有良好的有效性。综上所述,本研究建议未来在设计具备强泛化能力的行人检测器时,应更加重视跨数据集评估的指导作用。相关代码与模型已开源,可通过 https://github.com/hasanirtiza/Pedestron 获取。

代码仓库

hasanirtiza/Pedestron
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
pedestrian-detection-on-caltechPedestron
Heavy MR^-2: 25.7
Reasonable Miss Rate: 1.76
pedestrian-detection-on-citypersonsPedestron
Bare MR^-2: 6.2
Heavy MR^-2: 33.9
Large MR^-2: 4.3
Medium MR^-2: 3.0
Partial MR^-2: 5.7
Reasonable MR^-2: 7.5
Small MR^-2: 8.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
可泛化的行人检测:房间里的大象 | 论文 | HyperAI超神经