
摘要
将机器聚类与深度模型相结合在深度聚类中展现出显著的优势。该方法将数据处理流程修改为两个交替进行的阶段:特征聚类和模型训练。然而,这种交替安排可能导致不稳定性和计算负担问题。我们提出了一种无中心聚类算法——概率聚合聚类(Probability Aggregation Clustering, PAC),以主动适应深度学习技术,实现在线深度聚类的便捷部署。PAC 避免了使用聚类中心,并通过将聚类问题表述为具有新颖目标函数的优化问题,对概率空间和分布空间进行了对齐。基于 PAC 的计算机制,我们设计了一个通用的在线概率聚合模块,用于在小批量数据上执行稳定且灵活的特征聚类,并进一步构建了一个深度视觉聚类框架——深度 PAC(Deep PAC, DPAC)。大量实验表明,PAC 具有出色的聚类鲁棒性和性能,而 DPAC 在性能上显著优于当前最先进的深度聚类方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-clustering-on-cifar-10 | DPAC | ARI: 0.866 Accuracy: 0.934 Backbone: ResNet-34 NMI: 0.87 |
| image-clustering-on-cifar-100 | DPAC | ARI: 0.393 Accuracy: 0.555 Backbone: ResNet-34 NMI: 0.542 |
| image-clustering-on-imagenet-10 | DPAC | ARI: 0.935 Accuracy: 0.97 Backbone: ResNet-34 NMI: 0.925 |
| image-clustering-on-imagenet-dog-15 | DPAC | ARI: 0.598 Accuracy: 0.726 Backbone: ResNet-34 NMI: 0.667 |
| image-clustering-on-stl-10 | DPAC | ARI: 0.861 Accuracy: 0.934 Backbone: ResNet-34 NMI: 0.863 |