3 个月前

DetectoRS:基于递归特征金字塔与可切换空洞卷积的目标检测

DetectoRS:基于递归特征金字塔与可切换空洞卷积的目标检测

摘要

许多现代目标检测器通过采用“看两次、想两次”的机制实现了卓越的性能。本文在目标检测的主干网络设计中探索了这一机制。在宏观层面,我们提出了递归特征金字塔(Recursive Feature Pyramid),该结构将特征金字塔网络(Feature Pyramid Networks)的额外反馈连接引入自底向上的主干网络层中;在微观层面,我们提出了可切换空洞卷积(Switchable Atrous Convolution),该方法使用不同的空洞率对特征进行卷积,并通过切换函数融合结果。二者结合形成了DetectoRS模型,显著提升了目标检测的性能。在COCO测试集(test-dev)上,DetectoRS在目标检测任务中取得了55.7%的边界框平均精度(box AP),在实例分割任务中达到48.5%的掩码平均精度(mask AP),在全景分割任务中实现50.0%的全景分割精度(PQ),均达到当前最优水平。相关代码已公开发布。

代码仓库

FenHua/Robust_Logo_Detection
pytorch
GitHub 中提及
TeamA2020/Practice
pytorch
GitHub 中提及
joe-siyuan-qiao/DetectoRS
官方
pytorch
GitHub 中提及
Vishal-V/tf-models
tf
GitHub 中提及

基准测试

基准方法指标
instance-segmentation-on-cocoDetectoRS (ResNeXt-101-32x4d, multi-scale)
AP50: 71.1
AP75: 51.6
APL: 59.6
APM: 49.5
APS: 30.3
mask AP: 47.1
instance-segmentation-on-cocoDetectoRS (ResNeXt-101-64x4d, multi-scale)
AP50: 72.0
AP75: 53.3
APL: 61.5
APM: 50.9
APS: 31.6
mask AP: 48.5
object-detection-on-ai-todDetectoRS (ResNet-50-FPN)
AP: 14.8
AP50: 32.8
AP75: 11.4
APm: 28.0
APs: 28.3
APt: 10.8
APvt: 0.0
object-detection-on-cocoDetectoRS (ResNeXt-101-32x4d, single-scale)
AP50: 71.6
AP75: 58.5
APL: 66.9
APM: 56.5
APS: 33.9
box mAP: 53.3
object-detection-on-cocoDetectoRS (ResNeXt-101-64x4d, multi-scale)
AP50: 74.2
AP75: 61.1
APL: 68.1
APM: 58.4
APS: 37.7
box mAP: 55.7
object-detection-on-cocoDetectoRS (ResNeXt-101-32x4d, multi-scale)
AP50: 73.5
AP75: 60.1
APL: 66.4
APM: 57.3
APS: 37.4
box mAP: 54.7
panoptic-segmentation-on-coco-test-devDetectoRS (ResNeXt-101-64x4d, multi-scale)
PQ: 50
PQst: 37.2
PQth: 58.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DetectoRS:基于递归特征金字塔与可切换空洞卷积的目标检测 | 论文 | HyperAI超神经