3 个月前

Graph InfoClust:利用聚类级别的节点信息进行无监督图表示学习

Graph InfoClust:利用聚类级别的节点信息进行无监督图表示学习

摘要

无监督(或自监督)图表示学习在缺乏外部监督信息的情况下,对于促进各类图数据挖掘任务至关重要。其核心挑战在于如何将图结构信息以及节点和边的属性信息有效编码到低维表示空间中。现有大多数无监督方法倾向于使拓扑上相近的节点具有相似的表示。然而,近期研究表明,引入额外的图级信息(例如所有节点共享的全局信息),能够促使表示更好地捕捉图的全局特性,从而显著提升表示质量。然而,在大多数实际图结构中,仍存在大量可挖掘的潜在结构信息,例如节点往往属于一个或多个聚类,这些聚类反映了结构上相似的节点群组。基于这一观察,我们提出一种名为图信息聚类(Graph InfoClust, GIC)的图表示学习方法,旨在进一步捕捉聚类级别的信息内容。该方法通过可微分的K-means算法自动识别聚类,并通过最大化同一聚类内节点表示之间的互信息,实现聚类与表示的联合优化。这一优化过程促使节点表示能够捕获更丰富的语义信息和节点间交互模式,从而显著提升表示质量。实验结果表明,GIC在多个下游任务(包括节点分类、链接预测和节点聚类)中均优于现有最先进方法,平均性能提升幅度达0.9%至6.1%。

代码仓库

cmavro/Graph-InfoClust-GIC
pytorch
GitHub 中提及
cmavro/HeMI
pytorch
GitHub 中提及

基准测试

基准方法指标
link-prediction-on-citeseerGraph InfoClust (GIC)
AP: 96.8
AUC: 97
link-prediction-on-corasGraphite-VAE
AP: 93.5%
AUC: 93.7%
link-prediction-on-pubmedGraph InfoClust (GIC)
AP: 93.5%
AUC: 93.7%
node-classification-on-amz-compGraph InfoClust (GIC)
Accuracy: 81.5 ± 1.0
node-classification-on-amz-photoGraph InfoClust (GIC)
Accuracy: 90.4 ± 1.0
node-classification-on-citeseerGraph InfoClust (GIC)
Accuracy: 71.9 ± 1.4
node-classification-on-coauthor-csGraph InfoClust (GIC)
Accuracy: 89.4 ± 0.4
node-classification-on-coauthor-phyGraph InfoClust (GIC)
Accuracy: 93.1 ± 0.7
node-classification-on-cora-fixed-20-node-perGraph InfoClust (GIC)
Accuracy: 81.7 ± 1.5
node-classification-on-pubmedGraph InfoClust (GIC)
Accuracy: 77.4 ± 1.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Graph InfoClust:利用聚类级别的节点信息进行无监督图表示学习 | 论文 | HyperAI超神经