3 个月前

深度自适应图像聚类

深度自适应图像聚类

摘要

图像聚类是机器学习与计算机视觉领域中一项关键但极具挑战性的任务。现有方法通常忽视了特征学习与聚类之间的协同关系。为解决这一问题,本文提出一种深度自适应聚类方法(Deep Adaptive Clustering, DAC),将聚类问题重新建模为二元成对分类框架,用以判断图像对是否属于同一簇。在DAC中,图像间的相似性通过由深度卷积网络(ConvNet)生成的标签特征之间的余弦距离进行计算。通过引入特定约束,所学习到的标签特征倾向于逼近单热向量(one-hot vectors),从而可用于图像聚类。主要挑战在于图像聚类中真实相似性关系未知。为此,本文提出一种交替迭代的自适应学习算法(Adaptive Learning Algorithm),在每轮迭代中交替地选择带标签样本并训练ConvNet。最终,基于学习到的标签特征实现图像的自动聚类。实验结果表明,DAC在五个主流数据集上均取得了当前最优的性能表现,例如在MNIST数据集上达到97.75%的聚类准确率,在CIFAR-10上达到52.18%,在STL-10上达到46.99%。

基准测试

基准方法指标
image-clustering-on-cifar-10DAC
ARI: 0.301
Accuracy: 0.522
Backbone: ConvNet
NMI: 0.4
Train set: Train+Test
image-clustering-on-cifar-100DAC
Accuracy: 0.238
NMI: 0.185
Train Set: Train+Test
image-clustering-on-imagenet-10DAC
Accuracy: 0.527
NMI: 0.394
image-clustering-on-imagenet-dog-15DAC
Accuracy: 0.275
NMI: 0.219
image-clustering-on-stl-10DAC
Accuracy: 0.470
Backbone: ConvNet
NMI: 0.366
Train Split: Train+Test
image-clustering-on-tiny-imagenetDAC
Accuracy: 0.066
NMI: 0.190

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
深度自适应图像聚类 | 论文 | HyperAI超神经