4 个月前

基于强度拓扑图的聚类方法

基于强度拓扑图的聚类方法

摘要

精确性、对噪声和尺度的鲁棒性、可解释性、速度以及易用性(ARISE) 是优秀聚类算法的关键要求。然而,同时实现这些目标具有挑战性,大多数先进的方法仅关注其中的一部分。为了全面考虑这些方面,我们提出了一种新的聚类算法,即基于强度拓扑图的聚类算法(GIT, Clustering Based on Graph of Intensity Topology)。GIT 考虑了局部和全局数据结构:首先根据样本的强度峰值形成局部聚类,然后估计这些局部聚类之间的全局拓扑图(topo-graph)。我们利用预测类别比例与先验类别比例之间的 Wasserstein 距离自动剪切 topo-graph 中的噪声边,并将连接的局部聚类合并为最终聚类。随后,我们将 GIT 与七种竞争算法在五个合成数据集和九个真实世界数据集上进行了比较。凭借快速的局部聚类检测、稳健的 topo-graph 构建以及准确的边剪切,GIT 展现了出色的 ARISE 性能,并显著超越了其他非凸聚类方法。例如,在 MNIST 和 FashionMNIST 数据集上,GIT 的 F1 分数比其他方法高出约 10%。代码可在以下链接获取:https://github.com/gaozhangyang/GIT。

基准测试

基准方法指标
clustering-algorithms-evaluation-on-fashion-2QuickShiftPP
ARI: 16%
F1-score: 42%
NMI: 41%
clustering-algorithms-evaluation-on-fashion-2SpectACI
ARI: 29%
F1-score: 47%
NMI: 45%
clustering-algorithms-evaluation-on-fashion-2Spectral Clustering
ARI: 34%
F1-score: 43%
NMI: 49%
clustering-algorithms-evaluation-on-fashion-2AE+GIT
ARI: 49%
F1-score: 65%
NMI: 61%
clustering-algorithms-evaluation-on-fashion-2k-Means++
ARI: 35%
F1-score: 39%
NMI: 51%
clustering-algorithms-evaluation-on-fashion-2GIT
ARI: 32%
F1-score: 56%
NMI: 51%
clustering-algorithms-evaluation-on-mnistk-Means++
ARI: 36%
F1-score: 50%
NMI: 45%
clustering-algorithms-evaluation-on-mnistGIT
ARI: 42%
F1-score: 59%
NMI: 53%
clustering-algorithms-evaluation-on-mnistSpectACI
ARI: 17%
F1-score: 40%
NMI: 33%
clustering-algorithms-evaluation-on-mnistQuickShiftPP
ARI: 13%
F1-score: 45%
NMI: 45%
clustering-algorithms-evaluation-on-mnistSpectral Clustering
ARI: 33%
F1-score: 41%
NMI: 44%
clustering-algorithms-evaluation-on-mnistAE+GIT
ARI: 77%
F1-score: 88%
NMI: 81%
clustering-algorithms-evaluation-on-olivettiSpectral Clustering
ARI: 19%
F1-score: 37%
NMI: 66%
clustering-algorithms-evaluation-on-olivettik-Means++
ARI: 38%
F1-score: 52%
NMI: 74%
clustering-algorithms-evaluation-on-olivettiGIT
ARI: 45%
F1-score: 62%
NMI: 78%
clustering-algorithms-evaluation-on-olivettiSpectACI
ARI: 21%
F1-score: 34%
NMI: 61%
clustering-algorithms-evaluation-on-olivettiQuickShiftPP
ARI: 38%
F1-score: 60%
NMI: 79%

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于强度拓扑图的聚类方法 | 论文 | HyperAI超神经