
摘要
图嵌入方法从图中生成无监督的节点特征,这些特征可以用于各种机器学习任务。现代图,尤其是在工业应用中,包含数十亿个节点和数万亿条边,这超出了现有嵌入系统的处理能力。我们提出了PyTorch-BigGraph(PBG),这是一种对传统多关系嵌入系统进行若干改进的嵌入系统,使其能够扩展到包含数十亿个节点和数万亿条边的图上。PBG通过图划分技术在单机或分布式环境中训练任意大小的嵌入。我们在常见的基准测试中展示了与现有嵌入系统相当的性能,同时支持扩展到任意大的图并在多台机器上并行化。我们还在几个大型社交网络图以及完整的Freebase数据集上训练和评估了嵌入,该数据集包含超过1亿个节点和20亿条边。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-prediction-on-fb15k-1 | PyTorch BigGraph (ComplEx) | Hits@10: 0.872 MRR: 0.79 MRR raw: 0.242 |
| link-prediction-on-livejournal | PBG (1 partition) | Hits@10: 0.857 MR: 245.9 |
| link-prediction-on-livejournal | PyTorch BigGraph | MRR: 0.749 |
| link-prediction-on-youtube | PyTorch BigGraph | Macro F1: 40.9 Micro F1: 48 |