
摘要
弱监督目标检测(WSOD)是一项具有挑战性的任务,当仅提供图像类别监督时,需要同时学习目标位置和目标检测器。许多弱监督目标检测方法采用了多示例学习(MIL),并且其损失函数是非凸的,这使得在训练过程中容易陷入局部最小值(错误地定位目标部分),而无法捕捉到完整的目标范围。本文中,我们引入了一种连续优化方法到多示例学习中,从而创建了连续多示例学习(C-MIL),旨在以系统的方式缓解非凸性问题。我们将实例划分为空间相关子集和类别相关子集,并在这些子集中定义一系列平滑的损失函数来近似原始的损失函数。优化平滑的损失函数可以防止训练过程过早陷入局部最小值,并有助于发现稳定的语义极端区域(SSERs),这些区域指示了完整的目标范围。在PASCAL VOC 2007和2012数据集上,C-MIL显著提升了弱监督目标检测和弱监督目标定位的最新水平。
代码仓库
Winfrand/C-MIL
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| weakly-supervised-object-detection-on-pascal | C-MIL | MAP: 46.7 |
| weakly-supervised-object-detection-on-pascal-1 | FRCNN C-MIL | MAP: 53.1 |