4 个月前

面向无监督的大规模图像集合中的多目标发现

面向无监督的大规模图像集合中的多目标发现

摘要

本文解决了在无需任何监督的情况下发现图像集合中存在物体的问题。我们在Vo等人(CVPR 2019)的优化方法基础上进行了几项关键创新:(1) 我们提出了一种基于显著性的区域提议算法,该算法在与其他竞争方法相比时,与真实物体的重叠率显著提高。此过程利用了经过分类任务训练但未使用任何边界框信息的现成CNN特征,除此之外完全无监督。(2) 我们利用提议固有的层次结构作为Vo等人提出的物体发现方法的有效正则化手段,从而在多个标准基准测试中大幅超越现有技术水平。(3) 我们采用两阶段策略,首先使用小规模随机图像集选择有潜力的提议,然后再使用整个图像集合来发现其所描绘的物体。据我们所知,这是首次实现对包含多达20,000张图像的数据集中每张图片中的多个物体进行发现,相比现有方法提高了五倍以上,并且是迈向真正大规模无监督图像解释的第一步。

代码仓库

基准测试

基准方法指标
multi-object-colocalization-on-voc-allrOSD
Detection Rate: 49.4
multi-object-colocalization-on-voc12rOSD
Detection Rate: 51.5
multi-object-discovery-on-coco-20kLarge-scale rOSD
Detection Rate: 12.0
multi-object-discovery-on-voc-allrOSD
Detection Rate: 37.6
multi-object-discovery-on-voc-allLarge-scale rOSD
Detection Rate: 38.3
multi-object-discovery-on-voc12Large-scale rOSD
Detection Rate: 41.2
multi-object-discovery-on-voc12rOSD
Detection Rate: 40.4
single-object-discovery-on-coco-20krOSD
CorLoc: 48.5
single-object-discovery-on-coco-20krOSD + CAD
CorLoc: 53.0
single-object-discovery-on-object-discoveryrOSD
CorLoc: 89.2
single-object-discovery-on-voc-6x2rOSD
CorLoc: 72.5
single-object-discovery-on-voc-allrOSD
CorLoc: 49.3
single-object-discovery-on-voc-allLarge-scale rOSD
CorLoc: 49.4
single-object-discovery-on-voc12Large-scale rOSD
CorLoc: 51.9
single-object-discovery-on-voc12rOSD
CorLoc: 51.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
面向无监督的大规模图像集合中的多目标发现 | 论文 | HyperAI超神经