
摘要
聚类在许多数据驱动的应用领域中占据核心地位,关于距离函数和分组算法的研究已经非常广泛。然而,针对学习用于聚类的表示的研究相对较少。本文提出了一种称为深度嵌入聚类(Deep Embedded Clustering, DEC)的方法,该方法利用深度神经网络同时学习特征表示和聚类分配。DEC 学习从数据空间到低维特征空间的映射,在该特征空间中迭代优化聚类目标。我们在图像和文本语料库上的实验评估表明,DEC 相比现有最先进方法有显著改进。
代码仓库
AhmedYounes94/Semi-supervised-BERT-NER
tf
GitHub 中提及
AdamStein97/Semi-Supervised-BERT-NER
tf
GitHub 中提及
linqinghong/Deep-Clustering-Paper
GitHub 中提及
ArronHZG/reid-baseline
pytorch
GitHub 中提及
chiqunz/Unsupervised_Models
tf
GitHub 中提及
probabilistic-and-interactive-ml/breaking-the-reclustering-barrier
pytorch
GitHub 中提及
yamilvindas/gdec
pytorch
GitHub 中提及
shyhyawJou/DEC-Pytorch
pytorch
GitHub 中提及
yamilvindas/imbalanced_dec_regularization
pytorch
GitHub 中提及
DIDSR/DomId
pytorch
GitHub 中提及
elitalobo/Hierarchical-RL-Algorithms
pytorch
GitHub 中提及
vlukiyanov/pt-dec
pytorch
GitHub 中提及
NeptuneProjects/RISCluster
pytorch
GitHub 中提及
NeptuneProjects/RISClusterPT
pytorch
GitHub 中提及
gdec-submission/gdec
pytorch
GitHub 中提及
Deepayan137/DeepClustering
pytorch
GitHub 中提及
xiaopeng-liao/DEC_pytorch
pytorch
GitHub 中提及
piiswrong/dec
官方
mxnet
aciobanusebi/deep-clustering
tf
GitHub 中提及
NeptuneProjects/RISWorkflow
GitHub 中提及
Derek-Wds/MAD-VAE
pytorch
GitHub 中提及
DanielKim0/Gerstein-Lab-Breakseq
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-clustering-on-cifar-10 | DEC | ARI: 0.161 Accuracy: 0.301 Backbone: Custom NMI: 0.25 Train set: Train+Test |
| image-clustering-on-cifar-100 | DEC | Accuracy: 0.185 NMI: 0.136 Train Set: Train+Test |
| image-clustering-on-cmu-pie | DEC (KL based) | Accuracy: 0.801 NMI: 0.924 |
| image-clustering-on-imagenet-10 | DEC | Accuracy: 0.381 NMI: 0.282 |
| image-clustering-on-imagenet-dog-15 | DEC | Accuracy: 0.195 NMI: 0.122 |
| image-clustering-on-stl-10 | DEC | Accuracy: 0.359 NMI: 0.276 Train Split: Train+Test |
| image-clustering-on-tiny-imagenet | DEC | Accuracy: 0.037 NMI: 0.115 |
| image-clustering-on-youtube-faces-db | DEC (KL based) | Accuracy: 0.371 NMI: 0.446 |
| unsupervised-image-classification-on-svhn | DEC | # of clusters (k): 10 Acc: 11.90 |