4 个月前

标签技巧:使用图神经网络进行多节点表示学习的理论

标签技巧:使用图神经网络进行多节点表示学习的理论

摘要

在本文中,我们提出了一种使用图神经网络(GNNs)进行多节点表示学习的理论框架(即对一组超过一个节点的学习表示感兴趣,例如链接)。我们知道,GNN 是设计用于学习单个节点表示的。当需要学习涉及多个节点的节点集合表示时,以往研究中的常见做法是直接将 GNN 获得的单个节点表示聚合为一个联合的节点集合表示。在本文中,我们揭示了这种方法的一个基本限制,即无法捕捉节点集合内节点之间的依赖关系,并论证了直接聚合单个节点表示并不能产生有效的多节点联合表示。随后,我们注意到一些成功的多节点表示学习方法,包括 SEAL、距离编码(Distance Encoding)和 ID-GNN,都采用了节点标记技术。这些方法首先根据目标节点集合与图中其他节点的关系对图中的节点进行标记,然后再应用 GNN。接着,将标记后的图中获得的节点表示聚合为一个节点集合表示。通过研究这些方法的内部机制,我们将这些节点标记技术统一为一种最通用的形式——标记技巧(labeling trick)。我们证明了,在使用标记技巧的情况下,具有足够表达能力的 GNN 可以学习到最具表达力的节点集合表示,从而原则上可以解决任何关于节点集合的联合学习任务。我们在一个重要的一对二节点表示学习任务——链接预测上进行了实验验证,结果支持了我们的理论。我们的工作解释了先前基于节点标记的方法表现出色的原因,并为使用 GNN 进行多节点表示学习奠定了理论基础。

代码仓库

基准测试

基准方法指标
link-property-prediction-on-ogbl-citation2SEAL
Ext. data: No
Number of params: 260802
Test MRR: 0.8767 ± 0.0032
Validation MRR: 0.8757 ± 0.0031
link-property-prediction-on-ogbl-collabSEAL-nofeat (val as input)
Ext. data: No
Number of params: 501570
Test Hits@50: 0.6474 ± 0.0043
Validation Hits@50: 0.6495 ± 0.0043
link-property-prediction-on-ogbl-collabSEAL-nofeat
Ext. data: No
Number of params: 501570
Test Hits@50: 0.5471 ± 0.0049
Validation Hits@50: 0.6495 ± 0.0043
link-property-prediction-on-ogbl-ddiSEAL
Ext. data: No
Number of params: 531138
Test Hits@20: 0.3056 ± 0.0386
Validation Hits@20: 0.2849 ± 0.0269
link-property-prediction-on-ogbl-ppaSEAL
Ext. data: No
Number of params: 709122
Test Hits@100: 0.4880 ± 0.0316
Validation Hits@100: 0.5125 ± 0.0252

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
标签技巧:使用图神经网络进行多节点表示学习的理论 | 论文 | HyperAI超神经