
摘要
图神经网络(Graph Neural Networks, GNNs)已成为解决各类图结构学习任务的关键工具。值得注意的是,当前大多数GNN架构均基于同质性(homophily)假设运行,无论该假设是显式提出还是隐含存在。尽管这一基础假设被广泛采用,但其适用性并非普适,可能导致学习效果上的潜在局限。本文中,我们首次将“一个节点对应一个感受野”这一主流概念引入异质性图(heterophilic graph)场景。通过构建代理标签预测器,我们使每个节点能够拥有一个潜在的预测分布,从而帮助其相连节点判断是否应聚合邻接节点的信息。最终,每个节点均可具备独特的聚合层数与模式,正如每片雪花都独一无二、各具特征。基于上述观察,我们创新性地提出“异质性雪花假说”(Heterophily Snowflake Hypothesis),并为此提供了一种高效可行的解决方案,以指导并推动异质性图及相关领域的研究发展。我们开展了全面的实验验证,涵盖以下四个方面:(1)在10个具有不同异质性比率的图数据集上,基于10种不同主干网络(backbones)的主实验结果;(2)在多种深层GNN主干网络(如SGC、JKNet等)上评估模型的可扩展性,覆盖2、4、6、8、16、32层等多种深度设置;(3)与传统“雪花假说”进行对比分析;(4)与现有图剪枝算法在效率上的比较。实验结果表明,本框架具备高度通用性,可灵活集成于多种GNN架构中,在提升性能的同时实现深层次增强,并提供一种可解释的方法以选择最优网络深度。源代码已公开,访问地址为:https://github.com/bingreeky/HeteroSnoH。
代码仓库
bingreeky/heterosnoh
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| node-classification-on-actor | MGNN + Hetero-S (4 layers) | Accuracy: 35.99 |
| node-classification-on-chameleon | JKNet + Hetero-S (8 layers) | Accuracy: 70.18 |
| node-classification-on-cornell | MGNN + Hetero-S (4 layers) | Accuracy: 68.18 |
| node-classification-on-squirrel | JKNet + Hetero-S (8 layers) | Accuracy: 57.83 |
| node-classification-on-texas | MGNN + Hetero-S (8 layers) | Accuracy: 93.09 |
| node-classification-on-wisconsin | MGNN + Hetero-S (6 layers) | Accuracy: 88.77 |