
摘要
图分类在许多科学领域中是一个重要的问题。它涉及根据蛋白质和化学化合物的功能或化学和结构特性将其归类到不同的类别中。在监督学习环境中,这一问题可以表述为从一组带有标签的图中学习其结构、特征以及特征之间的关系,并能够准确预测未见过的图的标签或类别。在这一任务中,一个显著的难题在于尝试应用已建立的分类算法时,需要对图进行固定大小的矩阵或张量表示,而这些图的节点数和边数可能相差很大。基于先前将显式张量表示与标准图像分类器结合的工作,我们提出了一种模型,通过从给定的一组图中提取固定大小的张量信息,并使用胶囊网络(Capsule Network)来进行分类。本文考虑的是无向图,并且节点具有类别特征。利用标准基准化学和蛋白质数据集,我们展示了我们的图胶囊网络分类模型在仅进行有限超参数搜索的情况下,使用显式的张量表示方法,在性能上可以与当前最先进的图核方法和图神经网络模型相媲美。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-dd | BC + Capsules | Accuracy: 74.86% |
| graph-classification-on-enzymes | BC + Capsules | Accuracy: 27% |
| graph-classification-on-mutag | BC + Capsules | Accuracy: 88.9% |
| graph-classification-on-nci1 | BC + Capsules | Accuracy: 65.9% |
| graph-classification-on-nci109 | BC + Capsules | Accuracy: 58.04 |
| graph-classification-on-proteins | BC + Capsules | Accuracy: 74.1% |
| graph-classification-on-ptc | BC + Capsules | Accuracy: 69% |