3 个月前

仅使用公开数据集的强鲁棒性与可复现性目标检测器

仅使用公开数据集的强鲁棒性与可复现性目标检测器

摘要

本工作提出Focal-Stable-DINO,一种强大且可复现的目标检测模型,在仅使用7亿参数的情况下,无需任何测试时增强(test-time augmentation),即可在COCO val2017上达到64.6 AP,在COCO test-dev上达到64.8 AP。该模型结合了性能强大的FocalNet-Huge主干网络与高效稳定的Stable-DINO检测器。与现有SOTA模型依赖大量参数、复杂的训练技术以及大规模私有数据或合并数据集不同,本模型仅在公开可用的Objects365数据集上进行训练,从而确保了方法的可复现性。

代码仓库

idea-research/stabledino
pytorch
GitHub 中提及
microsoft/FocalNet
官方
pytorch
GitHub 中提及
idea-research/stable-dino
pytorch
GitHub 中提及

基准测试

基准方法指标
object-detection-on-cocoFocal-Stable-DINO (Focal-Huge, no TTA)
AP50: 81.7
AP75: 71.5
APL: 78
APM: 67.6
APS: 48.6
Params (M): 689
box mAP: 64.8
object-detection-on-coco-minivalFocal-Stable-DINO (Focal-Huge, no TTA)
AP50: 81.5
AP75: 71.4
APL: 78.5
APM: 68.5
APS: 50.4
Params (M): 689
box AP: 64.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供