3 个月前

V2F-Net:遮挡行人检测的显式分解

V2F-Net:遮挡行人检测的显式分解

摘要

遮挡问题在行人检测中极具挑战性。本文提出了一种简单而有效的检测方法——V2F-Net,该方法显式地将遮挡行人检测任务分解为可见区域检测与完整身体框估计两个子任务。V2F-Net由两个子网络构成:可见区域检测网络(Visible Region Detection Network, VDN)和完整身体估计网络(Full Body Estimation Network, FEN)。VDN负责定位行人可见区域,而FEN则基于可见区域框来估计完整的行人边界框。此外,为进一步提升完整身体的估计精度,本文提出了一种新型的基于嵌入的部件感知模块(Embedding-based Part-aware Module, EPM)。该模块通过监督每个身体部件的可见性,促使网络提取蕴含关键部件信息的特征表示。通过在两个具有挑战性的数据集上开展的多项实验,我们验证了V2F-Net的有效性。相较于FPN基线模型,V2F-Net在CrowdHuman数据集上实现了5.85%的AP提升,在CityPersons数据集上实现了2.24%的MR-2性能改进。此外,该方法在单阶段与双阶段检测器上均表现出一致的性能增益,充分验证了其良好的通用性。

基准测试

基准方法指标
object-detection-on-citypersonsV2F-Net
mMR: 10.08
object-detection-on-crowdhuman-full-bodyV2F-Net
AP: 91.03
Recall: 84.2
mMR: 42.28

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
V2F-Net:遮挡行人检测的显式分解 | 论文 | HyperAI超神经