
摘要
本文探讨了图神经网络(Graph Neural Networks, GNNs)在学习各类信息以实现链接预测方面的潜力,并简要回顾了现有的链接预测方法。我们的分析表明,GNNs难以有效捕捉两个节点之间共同邻居数量相关的结构信息,其根本原因在于邻域聚合机制所采用的基于集合的池化方式。此外,通过大量实验我们发现,可训练的节点嵌入(node embeddings)能够显著提升基于GNN的链接预测模型性能。尤为重要的是,我们观察到图的密度越高,这种性能提升越明显。这一现象可归因于节点嵌入的特性:在每个链接样本中,该链接的状态信息能够被编码至参与该链接邻域聚合的两个节点的嵌入表示中。在密度较高的图中,每个节点有更多机会参与其他节点的邻域聚合过程,从而将其嵌入中编码更多链接样本的状态信息,进而学习到更优的节点表示,以支持更准确的链接预测。最后,我们证明,本研究所得的洞察对于识别现有链接预测方法的局限性具有重要意义,可为未来开发更具鲁棒性的算法提供重要指导。
代码仓库
astroming/GNNHE
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-property-prediction-on-ogbl-citation2 | GCN + Heuristic Encoding | Ext. data: No Number of params: 372674 Test MRR: 0.8891 ± 0.0005 Validation MRR: 0.8892 ± 0.0005 |
| link-property-prediction-on-ogbl-ddi | GCN (node embedding) | Ext. data: No Number of params: 5125250 Test Hits@20: 0.9549 ± 0.0073 Validation Hits@20: 0.9098 ± 0.0294 |
| link-property-prediction-on-ogbl-ppa | GCN (node embedding) | Ext. data: No Number of params: 148144898 Test Hits@100: 0.6354 ± 0.0121 Validation Hits@100: 0.6524 ± 0.0096 |