
摘要
标签传播算法(Label Propagation, LPA)与图卷积神经网络(Graph Convolutional Networks, GCN)均为图上的消息传递算法,均用于解决节点分类任务。然而,二者在信息传播机制上存在差异:LPA 通过图的边传播节点标签信息,而 GCN 则传播并变换节点特征信息。尽管两者在概念上具有相似性,但其间的理论关联尚未得到系统研究。本文从两个维度深入探讨 LPA 与 GCN 之间的关系:(1)特征/标签平滑性,即分析某一节点的特征或标签如何在邻接节点间扩散;(2)特征/标签影响力,即衡量某一节点的初始特征或标签对另一节点最终特征或标签的影响程度。基于上述理论分析,本文提出一种端到端的统一模型,将 GCN 与 LPA 有机结合,用于节点分类任务。在该统一模型中,边权重为可学习参数,LPA 被用作正则化项,辅助 GCN 学习更优的边权重,从而提升分类性能。该模型可被理解为基于节点标签学习注意力权重,其注意力机制更具任务导向性,相较于现有的基于特征的注意力模型具有更强的语义相关性。在多个真实世界图数据集上的实验结果表明,所提模型在节点分类准确率方面显著优于当前主流的基于 GCN 的方法,展现出优越的性能。
代码仓库
achalagarwal/gcn-lpa
tf
GitHub 中提及
hwwang55/GCN-LPA
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| node-classification-on-citeseer | GCN-LPA | Accuracy: 78.7 ± 0.6 |
| node-classification-on-coauthor-cs | GCN-LPA | Accuracy: 94.8 ± 0.4 |
| node-classification-on-coauthor-phy | GCN-LPA | Accuracy: 96.9 ± 0.2 |
| node-classification-on-cora | GCN-LPA | Accuracy: 88.5% ± 1.5% |
| node-classification-on-pubmed | GCN-LPA | Accuracy: 87.8 ± 0.6 |