
摘要
网络嵌入(Network Embedding)是一种重要的方法,用于学习网络中顶点的低维表示,旨在捕捉并保留网络的结构特征。目前绝大多数现有的网络嵌入方法均采用浅层模型。然而,由于底层网络结构具有高度复杂性,浅层模型难以有效捕捉高度非线性的网络结构,从而导致网络表示性能欠佳。因此,如何设计一种能够有效捕捉高度非线性网络结构,并同时保留全局与局部网络结构特性的方法,仍是一个开放但至关重要的研究问题。为解决该问题,本文提出了一种结构化深度网络嵌入方法(Structural Deep Network Embedding, 简称SDNE)。具体而言,我们首先设计了一种半监督深度模型,该模型包含多层非线性函数,具备捕捉高度非线性网络结构的能力。随后,我们提出联合利用一阶邻近性(first-order proximity)与二阶邻近性(second-order proximity)来共同保留网络结构信息:其中,二阶邻近性由无监督组件用于捕捉网络的全局结构;而一阶邻近性则作为有监督组件中的监督信息,用于保留网络的局部结构。通过在半监督深度模型中联合优化这两种邻近性,所提方法能够同时有效保留网络的局部与全局结构特征,并对稀疏网络具有良好的鲁棒性。在实验方面,我们在五个真实世界网络数据集上进行了验证,涵盖语言网络、引文网络以及三个社交网络。实验结果表明,与现有基线方法相比,SDNE在重建原始网络方面表现显著更优,并在三项典型应用任务中均取得了显著提升,包括多标签分类、链接预测以及网络可视化。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| graph-classification-on-bp-fmri-97 | SDBN | Accuracy: 64.8% F1: 63.7% |
| graph-classification-on-hiv-dti-77 | SDBN | Accuracy: 65.9% F1: 65.6% |
| graph-classification-on-hiv-fmri-77 | SDBN | Accuracy: 66.5% F1: 66.7% |