
摘要
知识图谱补全是一项重要任务,旨在预测实体之间缺失的关联关系。知识图谱嵌入方法通过将实体和关系表示为嵌入向量,并建模它们之间的交互作用来计算三元组的匹配得分,从而完成该任务。以往的研究通常将每个嵌入视为一个整体,并建模这些整体嵌入之间的交互,这可能导致模型计算开销过大,或需要专门设计复杂的交互机制。针对这一问题,本文提出了一种基于块项格式(block term format)的多分区嵌入交互(Multi-Partition Embedding Interaction, MEI)模型,系统性地加以解决。MEI 将每个嵌入向量划分为多个子分区,从而高效地限制交互范围。局部交互采用 Tucker 张量格式建模,整体交互则通过块项张量格式建模,使得 MEI 能够在表达能力与计算成本之间实现灵活权衡,自动从数据中学习交互机制,并在链接预测任务上达到当前最优性能。此外,本文从理论上深入研究了参数效率问题,推导出一个简洁且经实证验证有效的最优参数权衡准则。同时,我们将 MEI 框架应用于解释先前模型中若干专门设计的交互机制,为其提供了新的统一解释视角。相关源代码已开源,地址为:https://github.com/tranhungnghiep/MEI-KGE。
代码仓库
tranhungnghiep/MEI-KGE
官方
pytorch
GitHub 中提及
tranhungnghiep/AnalyzeKGE
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-prediction-on-fb15k | MEI-BTD | Hits@1: 0.754 Hits@10: 0.893 Hits@3: 0.843 MRR: 0.806 |
| link-prediction-on-fb15k-1 | MEI (small) | Hits@1: 0.757 Hits@10: 0.878 Hits@3: 0.823 MRR: 0.800 |
| link-prediction-on-fb15k-237 | MEI | Hits@1: 0.271 Hits@10: 0.552 Hits@3: 0.402 MRR: 0.365 |
| link-prediction-on-kg20c | MEI (small) | Hits@1: 0.157 Hits@10: 0.368 Hits@3: 0.258 MRR: 0.230 |
| link-prediction-on-wn18 | MEI-BTD | Hits@1: 0.946 Hits@10: 0.957 Hits@3: 0.952 MRR: 0.950 |
| link-prediction-on-wn18 | MEI (small) | Hits@1: 0.946 Hits@10: 0.960 Hits@3: 0.953 MRR: 0.951 |
| link-prediction-on-wn18rr | MEI | Hits@1: 0.444 Hits@10: 0.551 Hits@3: 0.496 MRR: 0.481 |
| link-prediction-on-yago3-10 | MEI | Hits@1: 0.505 Hits@10: 0.709 Hits@3: 0.622 MR: 756 MRR: 0.578 |