
摘要
无监督图像分类是计算机视觉领域的一项具有挑战性的任务。基于深度学习的算法已取得卓越成果,其中最新方法采用从特征嵌入(embedding)与类别分配(class assignment)过程中统一损失函数的策略。然而,由于这两个过程本质上目标不同,联合优化可能带来次优解。为克服这一局限,本文提出一种新颖的两阶段算法:第一阶段通过嵌入模块进行预训练,第二阶段引入一个精炼模块,该模块同时执行特征嵌入与类别分配。在多个数据集上的实验结果表明,该模型在无监督任务中显著优于当前最优(SOTA)方法,具体表现为:在CIFAR-10数据集上达到81.0%的准确率(提升9.3个百分点),在CIFAR-100-20上达到35.3%的准确率(提升9.6个百分点),在STL-10数据集上达到66.5%的准确率(提升6.9个百分点)。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-clustering-on-cifar-10 | TSUC | ARI: - Accuracy: 0.81 Backbone: ResNet-18 NMI: - Train set: Train |
| image-clustering-on-cifar-100 | TSUC | Accuracy: 0.353 |
| image-clustering-on-stl-10 | TSUC | Accuracy: 0.665 Backbone: ResNet-18 |
| unsupervised-image-classification-on-cifar-10 | TSUC | Accuracy: 81.0 |
| unsupervised-image-classification-on-cifar-20 | TSUC | Accuracy: 35.3 |
| unsupervised-image-classification-on-stl-10 | TSUC | Accuracy: 66.50 |