
摘要
近年来,仅使用图像级标注的弱监督目标检测(Weakly Supervised Object Detection, WSOD)受到了广泛关注。现有基于多实例学习(Multiple Instance Learning, MIL)的方法容易陷入局部最优,其原因在于该机制倾向于仅从每张图像中最具判别性的对象实例进行学习,导致大量其他同类对象实例被遗漏,从而严重影响WSOD的性能。为解决这一问题,本文提出一种端到端的目标实例挖掘(Object Instance Mining, OIM)框架。该框架通过在空间图与外观图上引入信息传播机制,无需任何额外标注,即可检测图像中所有可能存在的目标实例。在迭代学习过程中,原本判别性较弱的同类对象实例能够逐步被识别并用于模型训练。此外,本文还设计了一种目标实例重加权损失函数,以增强对每个目标实例更大区域的学习,进一步提升检测性能。在两个公开数据集PASCAL VOC 2007和VOC 2012上的实验结果表明,所提出方法具有显著的有效性。
代码仓库
bigvideoresearch/OIM
官方
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| weakly-supervised-object-detection-on-pascal | OIM+IR+FRCNN | MAP: 46.4 |
| weakly-supervised-object-detection-on-pascal-1 | OIM+IR+FRCNN | MAP: 52.6 |