摘要
神经网络通常被设计用于处理张量形式的数据。本文提出一种新型神经网络架构,可直接处理任意结构的图数据。给定一个包含图数据的集合,形式为(G, y),其中 G 为图结构,y 为其类别标签,我们的目标是构建能够直接读取图数据并学习分类函数的神经网络。该任务面临两大挑战:其一,如何提取能够表征图中丰富信息的有用特征以用于分类;其二,如何以一种有意义且一致的顺序对图进行逐步读取。针对第一个挑战,我们设计了一种局部化图卷积模型,并揭示了其与两种图核方法之间的联系;针对第二个挑战,我们提出一种新颖的 SortPooling 层,该层能够对图的顶点进行一致性的排序,从而使得传统神经网络可以在此基础上进行训练。在多个基准图分类数据集上的实验结果表明,所提出的架构在性能上与当前最先进的图核方法及其他图神经网络方法相比具有高度竞争力。此外,该架构支持端到端的基于梯度的训练,可直接使用原始图结构,无需预先将图转换为向量表示。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-collab | DGCNN | Accuracy: 73.76% |
| graph-classification-on-collab | DGCNN (sum) | Accuracy: 69.45% |
| graph-classification-on-dd | DGCNN | Accuracy: 79.37% |
| graph-classification-on-dd | DGCNN (sum) | Accuracy: 78.72% |
| graph-classification-on-imdb-b | DGCNN (sum) | Accuracy: 51.69% |
| graph-classification-on-imdb-b | DGCNN | Accuracy: 70.03% |
| graph-classification-on-imdb-m | DGCNN | Accuracy: 47.83% |
| graph-classification-on-imdb-m | DGCNN (sum) | Accuracy: 42.76% |
| graph-classification-on-mutag | DGCNN | Accuracy: 85.83% |
| graph-classification-on-nci1 | DGCNN (sum) | Accuracy: 69.00% |
| graph-classification-on-proteins | DGCNN | Accuracy: 76.26% |