3 个月前

基于地标节点的二分图上的扩散坐标实现大规模谱聚类

基于地标节点的二分图上的扩散坐标实现大规模谱聚类

摘要

谱聚类因其能够有效分离非凸且不相交的流形而受到广泛关注,但其较高的计算复杂度严重限制了其实际应用。受Dhillon(2001)提出的文档-词共聚类框架的启发,本文提出一种基于地标点的可扩展谱聚类方法:首先利用选定的地标点集合与原始数据构建一个二部图,然后在该图上执行扩散过程,以获得用于聚类的一组扩散坐标。我们证明,所提出的算法可通过在原始数据与选定地标点之间的相似性矩阵上执行高效的运算来实现,因而具备处理大规模数据的能力。最后,通过在多个基准数据集上与当前最先进的可扩展算法进行对比,验证了该方法出色的性能表现。

基准测试

基准方法指标
image-document-clustering-on-pendigitsLBDM
Accuracy (%): 74.70
runtime (s): 3.08

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于地标节点的二分图上的扩散坐标实现大规模谱聚类 | 论文 | HyperAI超神经