4 个月前

Salience DETR:通过层次显著性过滤优化增强检测Transformer

Salience DETR:通过层次显著性过滤优化增强检测Transformer

摘要

DETR 类方法在端到端检测性能方面取得了显著提升。这些方法的主要两阶段框架执行密集自注意力机制,并选择一部分查询进行稀疏交叉注意力机制,这已被证明对提高性能有效,但同时也引入了沉重的计算负担和对稳定查询选择的高度依赖。本文指出,次优的两阶段选择策略由于所选查询与目标对象之间的不匹配,导致了尺度偏差和冗余问题。为了解决这些问题,我们提出了一种分层显著性过滤精炼方法,该方法仅对过滤后的判别性查询执行 Transformer 编码,从而在计算效率和精度之间取得更好的平衡。过滤过程通过一种新颖的尺度无关显著性监督机制克服了尺度偏差。为了补偿查询之间的语义错位,我们引入了精心设计的查询精炼模块以实现稳定的两阶段初始化。基于上述改进,提出的 Salience DETR 在三个具有挑战性的任务特定检测数据集上分别实现了 +4.0% AP、+0.2% AP 和 +4.4% AP 的显著性能提升,并且在 COCO 2017 数据集上以较少的浮点运算次数(FLOPs)达到了 49.2% AP。代码可在 https://github.com/xiuqhou/Salience-DETR 获取。

代码仓库

xiuqhou/Salience-DETR
官方
pytorch
GitHub 中提及
xunull/read-Salience-DETR
pytorch
GitHub 中提及
xiuqhou/relation-detr
pytorch
GitHub 中提及

基准测试

基准方法指标
object-detection-on-coco-2017-valSalience-DETR (Focal-L 1x)
AP: 57.3
AP50: 75.5
AP75: 62.3
APL: 74.5
APM: 61.8
APS: 40.9
Param.: 220M
object-detection-on-coco-2017-valSalience-DETR (ResNet50 1x)
AP: 50.0
AP50: 67.7
AP75: 54.2
APL: 64.4
APM: 54.4
APS: 33.3
Param.: 56M
object-detection-on-coco-2017-valSalience-DETR (Swin-L 1x)
AP: 56.5
AP50: 75.0
AP75: 61.5
APL: 72.8
APM: 61.2
APS: 40.2
Param.: 210M

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Salience DETR:通过层次显著性过滤优化增强检测Transformer | 论文 | HyperAI超神经