
摘要
近年来,多个数据集和开放性挑战任务相继被提出,推动了目标检测领域的发展。为构建更具通用性与强大性能的目标检测系统,本文提出一个全新的大规模基准数据集——BigDetection。我们的目标是通过精心设计的原则,简单地利用现有数据集(LVIS、OpenImages 和 Object365)中的训练数据,构建一个规模更大的数据集,以提升检测器的预训练效果。具体而言,我们构建了一个新的分类体系,统一了来自不同来源的异构标签空间。BigDetection 数据集包含 600 个物体类别,涵盖超过 340 万张训练图像和 3600 万个边界框,其规模在多个维度上均显著超越以往基准数据集,既带来了新的机遇,也提出了更高的挑战。大量实验验证了 BigDetection 作为评估各类目标检测方法的新基准的有效性,同时也证明了其在预训练任务中的卓越性能。
代码仓库
amazon-research/bigdetection
官方
pytorch
GitHub 中提及
amazon-science/bigdetection
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| object-detection-on-bigdetection-val | Faster R-CNN (R50) | AP: 18.9 AP50: 28.8 AP75: 20.5 |
| object-detection-on-bigdetection-val | CenterNet2 (R50-FPN) | AP: 23.1 AP50: 30.2 AP75: 24.9 |
| object-detection-on-bigdetection-val | YOLOv3 (D53) | AP: 9.7 AP50: 17.4 AP75: 9.7 |
| object-detection-on-bigdetection-val | Cascade R-CNN (R50-FPN) | AP: 24.1 AP50: 33.0 AP75: 25.8 |
| object-detection-on-bigdetection-val | Deformable DETR (R50) | AP: 13.1 AP50: 19.3 AP75: 14.2 |
| object-detection-on-bigdetection-val | Faster R-CNN (R50-FPN) | AP: 19.4 AP50: 29.3 AP75: 21.3 |