4 个月前

非同质图上的学习新基准

非同质图上的学习新基准

摘要

许多具有图结构的数据满足同质性原则,即连接的节点在特定属性上往往相似。因此,用于图机器学习任务的普遍数据集通常表现出高度的同质性,这使得利用同质性作为归纳偏置的方法得到了奖励。近期的研究指出这一特定的关注点,随着新的非同质性数据集的引入以及更适合低同质性环境的图表示学习模型的发展,这一领域正在发生变化。然而,这些数据集规模较小,不太适合真正测试新方法在非同质性环境中的有效性。我们提出了一系列改进的图数据集,其中节点标签关系不满足同质性原则。同时,我们引入了一种新的衡量同质性存在与否的方法,该方法在不同情况下比现有方法更为适用。我们在提出的这些数据集上对一系列简单方法和图神经网络进行了基准测试,为后续研究提供了新的见解。相关数据和代码可以在 https://github.com/CUAI/Non-Homophily-Benchmarks 获取。

代码仓库

基准测试

基准方法指标
fraud-detection-on-yelp-fraudGAT+JK
AUC-ROC: 90.04
node-classification-on-geniusLINK 
Accuracy: 73.56 ± 0.14
node-classification-on-geniusL Prop 2-hop
Accuracy: 67.04 ± 0.20
node-classification-on-geniusL Prop 1-hop
Accuracy: 66.02 ± 0.16
node-classification-on-geniusGATJK
Accuracy: 56.70 ± 2.07
node-classification-on-non-homophilic-1MLP-2
1:1 Accuracy: 93.87 ± 3.33
node-classification-on-non-homophilic-6GCN+JK
1:1 Accuracy: 60.99±0.14
node-classification-on-non-homophilic-6LINK
1:1 Accuracy: 57.71±0.36
node-classification-on-non-homophilic-6LProp (2hop)
1:1 Accuracy: 56.96±0.26
node-classification-on-non-homophilic-6GAT+JK
1:1 Accuracy: 59.66±0.92
node-classification-on-non-homophilic-6MLP-2
1:1 Accuracy: 66.55±0.72
node-classification-on-non-homophilic-6L Prop (1hop)
1:1 Accuracy: 56.50±0.41
node-classification-on-penn94GATJK
Accuracy: 80.69 ± 0.36
node-classification-on-penn94L Prop 2-hop
Accuracy: 74.13 ± 0.46
node-classification-on-penn94GCNJK
Accuracy: 81.63 ± 0.54
node-classification-on-penn94L Prop 1-hop
Accuracy: 63.21 ± 0.39
node-classification-on-penn94LINK 
Accuracy: 80.79 ± 0.49
node-classification-on-penn94MLP
Accuracy: 73.61 ± 0.40
node-classification-on-yelpchiGAT+JK
AUC-ROC: 90.04

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
非同质图上的学习新基准 | 论文 | HyperAI超神经