3 个月前

InfoSeg:基于互信息最大化的无监督语义图像分割

InfoSeg:基于互信息最大化的无监督语义图像分割

摘要

我们提出了一种基于局部与全局高层次图像特征之间互信息最大化的无监督语义图像分割新方法。本工作的核心思想是利用自监督图像表征学习领域的最新进展。现有的表征学习方法通常生成一个能够捕捉整幅图像语义信息的单一高层次特征,而我们则通过计算多个高层次特征,每个特征分别对应某一特定语义类别的图像区域。为此,我们设计了一种新颖的两阶段学习流程,包括分割阶段和互信息最大化阶段。在第一阶段,基于局部特征与全局特征对图像进行分割;在第二阶段,最大化局部特征与其所属类别高层次特征之间的互信息。训练过程中,仅使用无标签图像,并从随机网络初始化开始。在定量与定性评估方面,我们采用现有标准基准数据集以及本文首次提出的COCO-Persons数据集作为具有挑战性的新基准。实验结果表明,InfoSeg显著优于当前最先进的方法,例如在COCO-Stuff数据集上,像素准确率(Pixel Accuracy)指标相对提升达26%。

基准测试

基准方法指标
unsupervised-semantic-segmentation-on-cocoInfoSeg
Pixel Accuracy: 38.8
unsupervised-semantic-segmentation-on-coco-1InfoSeg
Pixel Accuracy: 73.8
unsupervised-semantic-segmentation-on-coco-3InfoSeg
Pixel Accuracy: 69.6
unsupervised-semantic-segmentation-on-potsdam-1InfoSeg
Pixel Accuracy: 71.6

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
InfoSeg:基于互信息最大化的无监督语义图像分割 | 论文 | HyperAI超神经