
摘要
我们研究了从无标签数据中同时学习k-means聚类与深度特征表示的问题,该问题具有重要意义,因为深度k-means有望超越传统的两阶段特征提取与浅层聚类策略。为此,我们通过引入Gumbel-Softmax重参数化技巧,提出了一种针对不可微k-means目标函数的梯度估计器。与以往深度聚类方法不同,我们的基于具体(concrete)分布的k-means模型能够直接优化标准k-means目标函数,并可实现端到端的高效训练,无需采用交替优化策略。我们在标准聚类基准上验证了所提方法的有效性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| online-clustering-on-cifar10 | CKM | online ACC: 15.2 online ARI: 1.4 online NMI: 2.8 |