4 个月前

node2vec:网络的可扩展特征学习方法

node2vec:网络的可扩展特征学习方法

摘要

在网络中的节点和边进行预测任务时,需要仔细设计用于学习算法的特征。近年来,表示学习领域的研究取得了显著进展,通过自动学习特征本身来简化预测过程。然而,现有的特征学习方法在捕捉网络中观察到的连接模式多样性方面还不够充分。本文提出了一种名为node2vec的算法框架,用于学习网络中节点的连续特征表示。在node2vec中,我们学习一种将节点映射到低维特征空间的方法,该方法最大化保留节点网络邻域的可能性。我们定义了一个灵活的节点网络邻域概念,并设计了一种有偏随机游走过程,能够高效地探索多样化的邻域。我们的算法推广了基于固定网络邻域概念的先前工作,并认为在探索邻域时增加灵活性是学习更丰富表示的关键。我们在多个来自不同领域的实际网络上进行了多标签分类和链接预测实验,结果表明node2vec优于现有的最先进技术。综上所述,我们的工作为在复杂网络中高效地学习最先进的任务无关表示提供了一种新的方法。

基准测试

基准方法指标
link-prediction-on-usairN2V
AUC: 91.44
link-property-prediction-on-ogbl-citation2Node2vec
Ext. data: No
Number of params: 374911105
Test MRR: 0.6141 ± 0.0011
Validation MRR: 0.6124 ± 0.0011
link-property-prediction-on-ogbl-collabNode2vec
Ext. data: No
Number of params: 30322945
Test Hits@50: 0.4888 ± 0.0054
Validation Hits@50: 0.5703 ± 0.0052
link-property-prediction-on-ogbl-ddiNode2vec
Ext. data: No
Number of params: 645249
Test Hits@20: 0.2326 ± 0.0209
Validation Hits@20: 0.3292 ± 0.0121
link-property-prediction-on-ogbl-ppaNode2vec
Ext. data: No
Number of params: 73878913
Test Hits@100: 0.2226 ± 0.0083
Validation Hits@100: 0.2253 ± 0.0088
malware-detection-on-android-malware-datasetnode2vec
Accuracy: 81.25
node-classification-on-blogcatalognode2vec
Accuracy: 21.50%
Macro-F1: 0.206
node-classification-on-wikipedianode2vec
Accuracy: 19.10%
Macro-F1: 0.179

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
node2vec:网络的可扩展特征学习方法 | 论文 | HyperAI超神经