
摘要
这项研究考虑了在特定度量空间中计算结构对象(如无向图)之间距离的问题,这些对象被视为概率分布。我们提出了一种新的运输距离(即最小化概率质量传输的总成本),揭示了结构对象空间的几何特性。与仅关注特征(通过考虑特征空间中的度量)或结构(将结构视为度量空间)的 Wasserstein 或 Gromov-Wasserstein 度量不同,我们的新距离同时利用了这两方面的信息,因此被称为融合 Gromov-Wasserstein 距离(Fused Gromov-Wasserstein, FGW)。在讨论其性质和计算方面之后,我们在一个图分类任务中展示了该方法的结果,其中我们的方法优于图核和深度图卷积网络。进一步利用 FGW 的度量性质,我们还展示了和讨论了一些有趣的几何对象,如图的 Fréchet 均值或重心,在聚类上下文中进行了说明。
代码仓库
tvayer/FGW
GitHub 中提及
rflamary/POT
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-enzymes | FGW sp | Accuracy: 71.00% |
| graph-classification-on-mutag | FGW wl h=2 sp | Accuracy: 86.42% |
| graph-classification-on-mutag | FGW wl h=4 sp | Accuracy: 88.42% |
| graph-classification-on-mutag | FGW raw sp | Accuracy: 83.26% |
| graph-classification-on-nci1 | FGW wl h=4 sp | Accuracy: 86.42% |
| graph-classification-on-nci1 | FGW raw sp | Accuracy: 72.82% |
| graph-classification-on-nci1 | FGW wl h=2 sp | Accuracy: 85.82% |
| graph-classification-on-proteins | FGW sp | Accuracy: 74.55% |