3 个月前

上下文感知的块网络用于小目标检测

上下文感知的块网络用于小目标检测

摘要

当前最先进的目标检测器通常通过逐步下采样输入图像,直至其由较小的特征图表示,这一过程会损失空间信息,从而削弱对小目标的表征能力。本文提出一种上下文感知块网络(Context-Aware Block Network, CAB Net),通过构建高分辨率且富含语义信息的特征图,以提升小目标检测性能。为增强高空间分辨率特征图的表征能力,我们精心设计了上下文感知块(Context-Aware Block, CAB)。CAB采用金字塔形空洞卷积(pyramidal dilated convolutions),在不降低特征图原始分辨率的前提下,融合多层级上下文信息。随后,我们将CAB模块集成至截断的主干网络(如VGG16)末端,该主干网络具有相对较小的下采样率(如8倍),并移除其后续所有层。CAB Net能够同时捕捉基础视觉模式与小目标的语义信息,显著提升小目标检测性能。在基准数据集Tsinghua-Tencent 100K与Airport上的实验结果表明,CAB Net在保持实时推理速度的同时,显著优于其他先进检测器,充分验证了其在小目标检测任务中的有效性。

基准测试

基准方法指标
traffic-sign-detection-on-tsinghua-tencentCABNet
mAP@0.5: 78.0

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
上下文感知的块网络用于小目标检测 | 论文 | HyperAI超神经