摘要
Mixup 是一种用于训练基于神经网络的图像分类器的先进数据增强方法,通过插值一对图像的特征和标签来生成合成样本。然而,由于图数据具有不规则性和复杂的连通性,将其应用于图学习任务面临较大挑战。本文中,我们提出了适用于图学习中两类基础任务——节点分类与图分类的 Mixup 方法。为实现对不规则图结构的插值,我们设计了双分支图卷积机制,用于混合配对节点的感受野子图。由于节点间的连通性,不同节点对之间的 Mixup 操作可能相互干扰,导致混合特征的失真。为此,我们提出了一种两阶段 Mixup 框架,该框架在图卷积过程中使用节点混合前其邻居节点的表示,从而有效阻断这种干扰。在图分类任务中,我们基于语义空间对结构复杂且多样的图进行插值。定性分析表明,所提出的 Mixup 方法能够帮助图神经网络(GNN)学习更具判别性的特征,并有效缓解过拟合问题。定量实验结果表明,该方法在标准数据集上对节点分类和图分类任务均显著提升了测试准确率与 F1-micro 分数,且提升具有持续性。总体而言,我们的方法在不增加图神经网络时间复杂度的前提下,有效增强了主流图神经网络的泛化能力,实现了良好的正则化效果。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| node-classification-on-pubmed | GCN + Mixup | Accuracy: 87.9% |