3 个月前

双重随机子空间聚类

双重随机子空间聚类

摘要

许多先进的子空间聚类方法遵循两步流程:首先构建数据点之间的相似性矩阵(affinity matrix),然后对这一相似性矩阵应用谱聚类(spectral clustering)以获得最终的聚类结果。现有研究大多聚焦于第一步——相似性矩阵的生成,通常利用线性子空间的自表达(self-expressive)特性来构造相似性,而对第二步——谱聚类过程本身则关注较少。此外,现有方法通常通过人为设定或任意选择的后处理步骤,对自表达聚类模型生成的相似性矩阵进行调整,以获得最终用于谱聚类的相似性矩阵,此类后处理方式可能显著影响整体聚类性能。在本研究中,我们通过联合学习数据的自表达表示与适用于谱聚类的具有良好归一化特性的相似性矩阵,将上述两个步骤统一起来。在所提出的模型中,我们对相似性矩阵施加双重随机性(doubly stochastic)约束,从而在理论上提供了一种合理的相似性矩阵归一化方法,同时充分利用了双重随机归一化在谱聚类中已被证实的优良性质。我们构建了一个通用框架,并推导出两种具体模型:一种是联合优化自表达表示与双重随机相似性矩阵;另一种是分步求解,依次优化其中一项。此外,我们利用问题中的稀疏性特征,设计了一种高效的主动集(active-set)算法用于分步求解器,显著提升了大规模数据集上的计算效率。实验结果表明,所提方法在计算机视觉领域多个常用数据集上均达到了当前最优的子空间聚类性能。

代码仓库

cptq/SubspaceClusteringJulia
官方
GitHub 中提及

基准测试

基准方法指标
image-clustering-on-coil-100J-DSSC
Accuracy: 0.796
NMI: 0.943
image-clustering-on-coil-100A-DSSC
Accuracy: 0.824
NMI: 0.946
image-clustering-on-coil-100A-DSSC (Scattered)
Accuracy: 0.984
NMI: 0.997
image-clustering-on-coil-100J-DSSC (Scattered)
Accuracy: 0.961
NMI: 0.992
image-clustering-on-coil-40A-DSSC (Scattered)
Accuracy: 1
NMI: 1
image-clustering-on-coil-40J-DSSC (Scattered)
Accuracy: 1
NMI: 1
image-clustering-on-extended-yale-bJ-DSSC
Accuracy: 0.924
NMI: 0.952
image-clustering-on-extended-yale-bA-DSSC
Accuracy: 0.917
NMI: 0.947
image-clustering-on-umistJ-DSSC (Scattered)
NMI: 0.939
image-clustering-on-umistA-DSSC (Scattered)
NMI: 0.935

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
双重随机子空间聚类 | 论文 | HyperAI超神经