3 个月前

SpotNet:用于目标检测的自注意力多任务网络

SpotNet:用于目标检测的自注意力多任务网络

摘要

人类在搜索不同类型的物体时,能够非常有效地将视觉注意力集中在相关区域。例如,当我们寻找车辆时,会关注街道,而非建筑物顶部。本文的动机在于通过多任务学习的方法,训练神经网络实现类似的人类视觉注意力机制。为训练视觉注意力,我们采用半监督方式生成前景/背景分割标签,利用背景减除或光流技术实现。基于这些标签,我们训练一个目标检测模型,使其在共享大部分网络参数的同时,既能生成前景/背景分割图,也能输出边界框。我们将这些分割图作为网络内部的自注意力机制,用于加权生成边界框所用的特征图,从而抑制非相关区域的信号干扰。实验结果表明,该方法在两个交通监控数据集上均显著提升了平均精度(mAP),并在UA-DETRAC和UAVDT两个基准数据集上达到了当前最优水平。

代码仓库

hu64/SpotNet
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
object-detection-on-ua-detracSpotNet
mAP: 86.8
object-detection-on-uavdtSpotNet
mAP: 52.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SpotNet:用于目标检测的自注意力多任务网络 | 论文 | HyperAI超神经