4 个月前

SPICE:图像聚类的语义伪标签方法

SPICE:图像聚类的语义伪标签方法

摘要

样本之间的相似性和聚类之间的差异是图像聚类中的两个关键方面。然而,当前的深度聚类方法在特征相似度或语义差异的估计上存在不准确的问题。本文提出了一种基于语义伪标签的图像聚类框架(Semantic Pseudo-labeling-based Image Clustering, SPICE),该框架将聚类网络分为用于测量实例级相似性的特征模型和用于识别聚类级差异的聚类头。我们设计了两种语义感知的伪标签算法:原型伪标签算法和可靠伪标签算法,这些算法使得在聚类过程中能够实现准确且可靠的自我监督。无需使用任何真实标签,我们通过三个阶段优化聚类网络:1)通过对比学习训练特征模型以测量实例相似性;2)使用原型伪标签算法训练聚类头以识别聚类语义;3)联合使用可靠伪标签算法训练特征模型和聚类头,以提高聚类性能。大量的实验结果表明,SPICE 在六个图像基准数据集上的三种流行指标上显著优于现有方法(约10%的提升),并建立了新的最先进聚类结果。尤为重要的是,SPICE 显著缩小了无监督分类与全监督分类之间的差距;例如,在 CIFAR-10 数据集上,其准确率仅相差2%(91.8%对93.8%)。我们的代码已公开发布在 https://github.com/niuchuangnn/SPICE。

代码仓库

niuchuangnn/SPICE
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
image-clustering-on-cifar-10SPICE*
ARI: 0.836
Accuracy: 0.918
Backbone: ResNet-18
NMI: 0.850
Train set: Train
image-clustering-on-cifar-100SPICE*
ARI: 0.422
Accuracy: 0.584
NMI: 0.583
Train Set: Train
image-clustering-on-imagenet-10SPICE (Full ImageNet pre-train)
ARI: 0.933
Accuracy: 0.969
NMI: 0.927
image-clustering-on-imagenet-dog-15SPICE
ARI: 0.526
Accuracy: 0.675
NMI: 0.627
image-clustering-on-stl-10SPICE*
Accuracy: 0.929
Backbone: ResNet-34
NMI: 0.860
Train Split: Train
image-clustering-on-tiny-imagenetSPICE
ARI: 0.161
Accuracy: 0.305
NMI: 0.449

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供