
摘要
持久图(PDs)在拓扑数据分析(TDA)中发挥着关键作用,常用于描述复杂形状的拓扑特性。持久图具有很强的稳定性,并已在多种学习场景中证明了其价值。然而,它们并不自然地存在于一个希尔伯特空间中,通常使用特定的距离度量进行比较,例如瓶颈距离。为了将持久图纳入学习流程,已提出了几种适用于持久图的核函数,重点在于这些核函数在面对持久图扰动时的RKHS距离稳定性。本文中,我们利用Wasserstein距离的切片Wasserstein近似(SW)定义了一种新的持久图核函数,该核函数不仅被证明是稳定的,而且对于PDs之间的Wasserstein距离 (d_1) 具有可证的判别能力(取决于PDs中的点数)。此外,我们还展示了其实际应用性,通过开发一种近似技术来减少核计算时间,并在多个基准测试中表明我们的方法与现有的PDs核函数相比具有优势。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-neuron-average | SW | Accuracy: 71.20 |
| graph-classification-on-neuron-binary | SW | Accuracy: 85.1 |
| graph-classification-on-neuron-multi | SW | Accuracy: 57.3 |