
摘要
近年来,仅使用图像级别标注的弱监督目标检测(Weakly Supervised Object Detection, WSOD)引起了越来越多的关注。尽管此类任务通常采用针对自然图像的特定领域解决方案,但我们发现,将简单的多实例学习方法应用于预训练的深度特征,即可在非摄影类数据集上取得优异性能,甚至可涵盖新类别。该方法无需任何微调或跨域学习,因而具有高效性,且可能适用于任意数据集和类别。我们探讨了该方法的多种变体,其中部分引入了多层感知机(multi-layer perceptron)和多面体分类器(polyhedral classifiers)。尽管方法本身简洁,但在多个公开可用的数据集上,包括绘画(People-Art、IconArt)、水彩画、剪贴画和漫画等,均展现出具有竞争力的检测性能,同时能够快速学习未见过的视觉类别。
代码仓库
ngonthier/Mi_max
tf
GitHub 中提及
nicaogr/Mi_max
官方
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| weakly-supervised-object-detection-on-1 | MI-max | MAP: 49.5 |
| weakly-supervised-object-detection-on-2 | MI-max | MAP: 38.4 |
| weakly-supervised-object-detection-on-3 | Polyhedral MI-max | MAP: 58.3 |
| weakly-supervised-object-detection-on-5 | MI-max | Mean mAP: 16.2 |
| weakly-supervised-object-detection-on-comic2k | MI-max | MAP: 27 |
| weakly-supervised-object-detection-on-iconart | MI_Net [wang_revisiting_2018] | MAP: 15.1 |