3 个月前

用于精确单次检测的并行残差双向融合特征金字塔网络

用于精确单次检测的并行残差双向融合特征金字塔网络

摘要

本文提出了一种用于快速且高精度单阶段目标检测的并行残差双向融合特征金字塔网络(Parallel Residual Bi-Fusion Feature Pyramid Network, PRB-FPN)。近年来,特征金字塔(Feature Pyramid, FP)在视觉检测任务中得到广泛应用,然而其传统的自顶向下路径由于池化操作带来的特征偏移,难以有效保持精确的定位能力。随着骨干网络层数加深,FP结构的优势逐渐减弱,且难以同时实现对小目标与大目标的高精度检测。为解决上述问题,本文提出一种新型并行特征金字塔结构,采用双向(自顶向下与自底向上)融合机制,并结合一系列改进设计,以保留高质量特征,提升定位精度。主要贡献包括以下四个方面:(1)设计了一种并行双向融合的特征金字塔结构,引入自底向上的融合模块(Bottom-up Fusion Module, BFM),可同时高精度地检测小目标与大目标;(2)提出一种拼接与重组织(Concatenation and Re-organization, CORE)模块,构建自底向上的特征融合路径,实现双向融合,有效恢复低层特征图中丢失的细节信息;(3)对CORE模块输出的特征进一步进行净化处理,以保留更丰富的上下文信息;该净化过程在自顶向下与自底向上两个路径中均可在少数迭代内完成;(4)在CORE模块中引入残差结构,形成新型的Re-CORE模块,显著提升网络训练稳定性,并可灵活适配多种深层或轻量级骨干网络。实验结果表明,所提出的PRB-FPN在UAVDT17和MS COCO两个基准数据集上均取得了当前最优的检测性能。相关代码已开源,地址为:https://github.com/pingyang1117/PRBNet_PyTorch。

代码仓库

pingyang1117/PRBNet_PyTorch
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
object-detection-on-uavdtPRB-FPN
mAP: 76.55
real-time-object-detection-on-cocoPRB-FPN6-E-ELAN(1280)
FPS (V100, b=1): 31
box AP: 56.9
real-time-object-detection-on-cocoPRB-FPN-MSP
FPS (V100, b=1): 94
box AP: 53.3
real-time-object-detection-on-cocoPRB-FPN-CSP
FPS (V100, b=1): 113
box AP: 51.8
real-time-object-detection-on-cocoPRB-FPN-ELAN
FPS (V100, b=1): 70
box AP: 52.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
用于精确单次检测的并行残差双向融合特征金字塔网络 | 论文 | HyperAI超神经