3 个月前

知识图谱嵌入如何外推至未见数据:一种语义证据视角

知识图谱嵌入如何外推至未见数据:一种语义证据视角

摘要

知识图谱嵌入(Knowledge Graph Embedding, KGE)旨在学习实体与关系的低维表示。目前,大多数KGE模型在推理(extrapolation)场景下取得了显著成功。具体而言,对于未在训练集中出现的三元组(h, r, t),经过训练的模型仍能准确预测缺失的头实体 h(即 ? r t)或尾实体 t(即 h r ?),这种对未见数据的泛化能力令人印象深刻。然而,现有大多数KGE研究主要聚焦于设计精细的三元组建模函数,其核心目标是衡量已观测三元组的合理性,却难以解释为何这些方法具备良好的外推能力,也未明确揭示促进KGE外推的关键因素。因此,本文致力于从两个方面深入探究KGE的外推机制:(1)KGE是如何实现对未见数据的外推的?(2)如何设计具备更强外推能力的KGE模型?针对第一个问题,我们从关系、实体和三元组三个层次系统分析了影响外推能力的关键因素,提出了三种可从训练集中观测到的语义证据(Semantic Evidences, SEs),这些证据能够为外推提供重要的语义信息。通过在多种典型KGE方法上的大量实验,我们验证了所提SEs的有效性。针对第二个问题,为更充分地利用上述三个层次的语义证据,我们提出了一种新型基于图神经网络(GNN)的KGE模型——语义证据感知图神经网络(Semantic Evidence-aware Graph Neural Network, SE-GNN)。在SE-GNN中,每一层次的语义证据均通过对应的邻域模式进行显式建模,并借助多层聚合机制实现充分融合,从而获得更具外推能力的知识表示。最终,在FB15k-237与WN18RR两个标准数据集上的大量实验表明,SE-GNN在知识图谱补全任务中达到了当前最优性能,并展现出显著优于现有方法的外推能力。本文代码已开源,地址为:https://github.com/renli1024/SE-GNN。

代码仓库

renli1024/se-gnn
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
link-prediction-on-fb15k-237SE-GNN (ours)
Hits@1: 0.271
Hits@10: 0.549
Hits@3: 0.399
MR: 157
MRR: 0.365
link-prediction-on-wn18rrSE-GNN (ours)
Hits@1: 0.446
Hits@10: 0.572
Hits@3: 0.509
MR: 3211
MRR: 0.484

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
知识图谱嵌入如何外推至未见数据:一种语义证据视角 | 论文 | HyperAI超神经