
摘要
本工作提出Focal-Stable-DINO,一种强大且可复现的目标检测模型,在仅使用7亿参数的情况下,无需任何测试时增强(test-time augmentation),即可在COCO val2017上达到64.6 AP,在COCO test-dev上达到64.8 AP。该模型结合了性能强大的FocalNet-Huge主干网络与高效稳定的Stable-DINO检测器。与现有SOTA模型依赖大量参数、复杂的训练技术以及大规模私有数据或合并数据集不同,本模型仅在公开可用的Objects365数据集上进行训练,从而确保了方法的可复现性。
代码仓库
idea-research/stabledino
pytorch
GitHub 中提及
microsoft/FocalNet
官方
pytorch
GitHub 中提及
idea-research/stable-dino
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-coco | Focal-Stable-DINO (Focal-Huge, no TTA) | AP50: 81.7 AP75: 71.5 APL: 78 APM: 67.6 APS: 48.6 Params (M): 689 box mAP: 64.8 |
| object-detection-on-coco-minival | Focal-Stable-DINO (Focal-Huge, no TTA) | AP50: 81.5 AP75: 71.4 APL: 78.5 APM: 68.5 APS: 50.4 Params (M): 689 box AP: 64.6 |