
摘要
本文提出了一种简单而有效的基于图的凝聚聚类算法,用于高维数据的聚类。我们探讨了图论中的两个基本概念——入度和出度在聚类背景下的不同作用。平均入度反映了样本附近的密度,而平均出度则刻画了样本周围的局部几何结构。基于这些洞察,我们通过平均入度和平均出度的乘积来定义聚类的亲和力测度。这种基于乘积的亲和力测度使得我们的算法对噪声具有鲁棒性。该算法具有三个主要优点:性能优良、实现简便和计算效率高。我们在两个基本的计算机视觉问题上测试了该算法:图像聚类和对象匹配。大量实验表明,该算法在这两个应用中均优于现有的最先进方法。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| image-clustering-on-coil-100 | GDL | Accuracy: 0.731 |
| image-clustering-on-coil-100 | GDL-U | NMI: 0.929 |
| image-clustering-on-coil-20 | GDL | Accuracy: 0.858 |
| image-clustering-on-coil-20 | GDL-U | NMI: 0.746 |
| image-clustering-on-coil-20 | AGDL | Accuracy: 0.858 NMI: 0.937 |
| image-clustering-on-extended-yale-b | AGDL | NMI: 0.91 |
| image-clustering-on-extended-yale-b | GDL-U | NMI: 0.91 |
| image-clustering-on-fashion-mnist | GDL | Accuracy: 0.627 NMI: 0.66 |
| image-clustering-on-mnist-full | GDL | Accuracy: 0.965 NMI: 0.913 |
| image-clustering-on-mnist-test | GDL | NMI: 0.91 |
| image-clustering-on-mnist-test | AGDL | NMI: 0.844 |
| image-clustering-on-usps | AGDL | NMI: 0.824 |