3 个月前

Group DETR v2:基于编码器-解码器预训练的强性能目标检测器

Group DETR v2:基于编码器-解码器预训练的强性能目标检测器

摘要

我们提出了一种基于编码器-解码器预训练与微调策略的强效目标检测方法。该方法名为 Group DETR v2,其架构基于视觉Transformer编码器 ViT-Huge~\cite{dosovitskiy2020image}、DETR 变体 DINO~\cite{zhang2022dino},以及一种高效的 DETR 训练方法 Group DETR~\cite{chen2022group}。训练流程包含三个阶段:首先在 ImageNet-1K 数据集上对 ViT-Huge 编码器进行自监督预训练并微调;随后在 Object365 数据集上对检测器进行预训练;最后在 COCO 数据集上进行微调。Group DETR v2 在 COCO test-dev 上取得了 64.5 的 mAP 指标,在 COCO 目标检测排行榜上刷新了当前最优性能(SoTA),相关结果可查阅:https://paperswithcode.com/sota/object-detection-on-coco。

基准测试

基准方法指标
object-detection-on-cocoGroup DETR v2
AP50: 81.8
AP75: 71.1
APL: 77.1
APM: 67.2
APS: 48.4
box mAP: 64.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Group DETR v2:基于编码器-解码器预训练的强性能目标检测器 | 论文 | HyperAI超神经