
摘要
网络嵌入(或图嵌入)已在许多实际应用中得到广泛应用。然而,现有的方法主要集中在单类型节点/边的网络上,无法很好地扩展以处理大规模网络。许多现实世界中的网络包含数十亿个节点和多种类型的边,每个节点都与不同的属性相关联。本文中,我们形式化了带属性多层异质网络的嵌入学习问题,并提出了一种统一框架来解决这一问题。该框架支持传递学习和归纳学习。我们还对所提出的框架进行了理论分析,展示了其与先前工作的联系,并证明了其更好的表达能力。我们在四个不同领域的具有挑战性的数据集上对所提出的框架进行了系统评估:Amazon、YouTube、Twitter 和 Alibaba。实验结果表明,通过该框架学习到的嵌入,在链接预测任务上相比现有最先进的方法可以实现统计学上的显著改进(例如,F1 分数提高了 5.99% 至 28.23%;p<<0.01, t 检验)。此外,该框架已成功部署在全球领先的电子商务公司阿里巴巴集团的推荐系统中。产品推荐的离线 A/B 测试结果进一步证实了该框架在实际应用中的有效性和高效性。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-prediction-on-alibaba | GATNE-I | F1-Score: 89.94 PR AUC: 95.04 ROC AUC: 84.2 |
| link-prediction-on-alibaba-s | GATNE-T | F1-Score: 62.48 PR AUC: 67.55 ROC AUC: 66.71 |
| link-prediction-on-amazon | GATNE-T | F1-Score: 92.87 PR AUC: 97.05 ROC AUC: 97.44 |
| link-prediction-on-twitter | GATNE-T | F1-Score: 84.96 PR AUC: 91.77 ROC AUC: 92.3 |
| link-prediction-on-youtube | GATNE-T | F1-Score: 76.83 PR AUC: 81.93 ROC AUC: 84.61 |