
摘要
图神经网络(Graph Neural Networks, GNNs)在处理图结构数据方面已展现出卓越的性能。然而,其表达能力存在显著局限,难以有效捕捉长程相互作用,且缺乏系统化的方法来建模高阶结构与群体交互。近期提出的细胞同构网络(Cellular Isomorphism Networks, CINs)通过基于细胞复形(cell complexes)的消息传递机制,解决了其中大部分问题。尽管如此,CINs仅利用边界消息和上向消息,未考虑底层复形中环结构之间的直接交互。而此类交互在许多现实世界复杂现象的建模中可能至关重要,例如超分子组装体的动力学行为、大脑中的神经活动模式以及基因调控过程。在本工作中,我们提出CIN++,对CINs中引入的拓扑消息传递机制进行增强。所提出的新型消息传递机制在每一层中允许细胞接收下向消息(lower messages),从而弥补了原有方法的不足。通过更全面地表征高阶结构与长程交互,我们的增强型拓扑消息传递机制在大规模、长程化学基准测试中取得了当前最优的性能表现,显著提升了模型的表达能力与实际应用效果。
代码仓库
twitter-research/cwn
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-hiv-dataset | CIN++ | ROC-AUC: 80.63 |
| graph-classification-on-hiv-dataset | CIN++-small | ROC-AUC: 80.26 |
| graph-classification-on-mutag | CIN++ | Accuracy: 94.4% |
| graph-classification-on-nci1 | CIN++ | Accuracy: 85.3% |
| graph-classification-on-nci109 | CIN++ | Accuracy: 84.5 |
| graph-classification-on-peptides-func | CIN++-500k | AP: 0.6569±0.0117 |
| graph-classification-on-proteins | CIN++ | Accuracy: 80.5 |
| graph-classification-on-ptc | CIN++ | Accuracy: 73.2% |
| graph-regression-on-peptides-struct | CIN++-500k | MAE: 0.2523 |
| graph-regression-on-zinc | CIN++ | MAE: 0.074 |
| graph-regression-on-zinc | CIN++-small | MAE: 0.091 |
| graph-regression-on-zinc | CIN++-500k | MAE: 0.077 |