3 个月前

基于互信息最大化与对抗正则化的无监督图像分割

基于互信息最大化与对抗正则化的无监督图像分割

摘要

语义分割是自主智能体实现场景理解的基本且关键任务之一。近年来,监督式机器学习与神经网络的快速发展,显著提升了该任务最先进方法的性能。然而,这些方法的优异表现高度依赖于大规模标注数据集的可用性。本文提出了一种全新的全无监督语义分割方法,称为信息最大化与对抗正则化分割(Information Maximization and Adversarial Regularization Segmentation, InMARS)。受人类感知机制的启发——人类将场景解析为感知上的语义群组,而非逐像素分析,本方法首先将输入图像划分为具有语义意义的区域(即超像素)。随后,通过最大化互信息(Mutual Information Maximization)并结合对抗训练策略,将这些区域聚类为具有语义意义的类别。为适配该任务的对抗训练机制,本文引入对抗性像素噪声与空间扰动,以在深度神经网络中强制实现光照不变性与几何不变性。实验结果表明,所提方法在两个广泛使用的无监督语义分割数据集(COCO-Stuff 和 Potsdam)上均达到了当前最优性能。

基准测试

基准方法指标
unsupervised-semantic-segmentation-on-cocoInMARS
Pixel Accuracy: 31.0
unsupervised-semantic-segmentation-on-coco-1InMARS
Pixel Accuracy: 73.1

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于互信息最大化与对抗正则化的无监督图像分割 | 论文 | HyperAI超神经