4 个月前

Weisfeiler和Leman走向稀疏：迈向可扩展的高阶图嵌入

Christopher Morris; Gaurav Rattan; Petra Mutzel

摘要

基于1维Weisfeiler-Leman算法的图核及其相应的神经架构最近作为（监督）图学习的强大工具崭露头角。然而，由于这些算法的纯粹局部性质，它们可能会忽略给定数据中的关键模式，并且只能处理二元关系。为了应对这一问题，$k$-维Weisfeiler-Leman算法通过考虑定义在顶点集合上的$k$-元组，并定义这些顶点元组之间合适的邻接关系来解决。因此，该算法能够捕捉顶点之间的高阶交互作用。然而，该算法在机器学习环境中应用时存在扩展性和过拟合的问题。因此，设计同时具备表达能力、可扩展性和非过拟合性的WL（Weisfeiler-Leman）图学习方法仍然是一个重要的开放问题。本文中，我们提出了局部变体及其相应的神经架构，这些方法仅考虑原始邻域的一个子集，从而提高了可扩展性并减少了过拟合的风险。我们的算法之一在区分非同构图的能力方面严格高于原始算法。实验研究表明，无论是核方法还是神经架构，局部算法都显著减少了计算时间，并防止了过拟合现象的发生。核版本在多个基准数据集上的图分类任务中建立了新的最先进水平，而神经版本则在大规模分子回归任务中展示了令人鼓舞的性能。

代码仓库

chrsmrrs/sparsewl

官方

pytorch

基准测试

基准	方法	指标
graph-classification-on-enzymes	δ-2-LWL	Accuracy: 58.2%
graph-classification-on-imdb-b	δ-2-LWL	Accuracy: 73.4%
graph-classification-on-imdb-m	δ-2-LWL	Accuracy: 50.5%
graph-classification-on-nci1	δ-2-LWL	Accuracy: 85.5%
graph-classification-on-nci109	δ-2-LWL	Accuracy: 84.7
graph-classification-on-proteins	δ-2-LWL	Accuracy: 74.60%
graph-classification-on-ptc	δ-2-LWL	Accuracy: 62.70%
graph-classification-on-reddit-b	δ-2-LWL	Accuracy: 89.0
graph-regression-on-zinc-full	δ-2-LGNN	Test MAE: 0.045±0.006
graph-regression-on-zinc-full	δ-2-GNN	Test MAE: 0.042±0.003

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

立即开始

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供