
摘要
在知识图谱(Knowledge Graph, KG)中预测缺失事实至关重要,因为现代知识图谱远未完备。由于人工标注成本高昂,当处理多语言表示的知识时,这一问题尤为突出。本文研究多语言知识图谱补全任务,利用有限的种子对齐作为桥梁,以整合多种语言的集体知识。然而,以往方法中的语言对齐机制尚未得到充分挖掘:(1)对齐实体对被同等对待,旨在最大程度地拉近平行实体之间的距离,但忽略了不同知识图谱在容量上的差异性;(2)种子对齐数据稀缺,而新对齐关系的识别通常依赖于噪声较大的无监督方式。为应对上述挑战,本文提出一种新颖的自监督自适应图对齐(Self-Supervised Adaptive Graph Alignment, SS-AGA)方法。具体而言,SS-AGA 将所有知识图谱融合为一个整体图结构,将对齐关系视为一种新的边类型。通过引入关系感知的注意力权重,该方法能够自适应地控制跨图的信息传播与噪声影响。同时,SS-AGA 设计了一种新型的对齐对生成器,能够在自监督框架下动态捕捉潜在的对齐关系。在公开的多语言 DBpedia 知识图谱以及新构建的工业级多语言电商知识图谱上的大量实验结果,充分验证了 SS-AGA 方法的有效性。
代码仓库
amzn/ss-aga-kgc
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| knowledge-graph-completion-on-dbp-5l | SS-AGA | MRR: 35.3 |
| knowledge-graph-completion-on-dbp-5l-english | SS-AGA | MRR: 32.1 |
| knowledge-graph-completion-on-dpb-5l-french | SS-AGA | MRR: 36.6 |