
摘要
我们介绍了CoDEx,这是一组从Wikidata和Wikipedia中提取的知识图谱补全数据集,其在范围和难度上改进了现有的知识图谱补全基准。在范围方面,CoDEx包含三个不同规模和结构的知识图谱、多语言实体和关系描述,以及数万个经过验证为错误但具有合理性的负样本三元组。为了表征CoDEx,我们进行了详尽的实证分析和基准测试实验。首先,我们对每个CoDEx数据集中的逻辑关系模式进行了分析。其次,我们报告了五种经过广泛调优的嵌入模型在CoDEx上的基线链接预测和三元组分类结果。最后,通过展示CoDEx覆盖了更多样化且可解释的内容,并且是一个更具挑战性的链接预测基准,我们将CoDEx与流行的FB15K-237知识图谱补全数据集区分开来。数据、代码和预训练模型可在https://bit.ly/2EPbrJs获取。
代码仓库
tsafavi/codex
官方
pytorch
GitHub 中提及
facebookresearch/ssl-relation-prediction
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| link-prediction-on-codex | RESCAL | Hits@1: 0.343 Hits@10: 0.635 Hits@3: 0.4926 MRR: 0.404 |
| link-prediction-on-codex | ComplEx | Hits@1: 0.293 Hits@10: 0.623 Hits@3: 0.4494 MRR: 0.404 |
| link-prediction-on-codex | ConvE | Hits@1: 0.219 Hits@10: 0.634 Hits@3: 0.4218 MRR: 0.444 |
| link-prediction-on-codex | TuckER | Hits@1: 0.372 Hits@10: 0.646 Hits@3: 0.5038 MRR: 0.444 |
| link-prediction-on-codex | TransE | Hits@1: 0.339 Hits@10: 0.638 Hits@3: 0.4975 MRR: 0.354 |
| link-prediction-on-codex-large | ConvE | Hits@1: 0.240 Hits@10: 0.420 Hits@3: 0.3298 MRR: 0.303 |
| link-prediction-on-codex-large | ComplEx | Hits@1: 0.237 Hits@10: 0.400 Hits@3: 0.3179 MRR: 0.294 |
| link-prediction-on-codex-large | RESCAL | Hits@1: 0.242 Hits@10: 0.419 Hits@3: 0.3313 MRR: 0.304 |
| link-prediction-on-codex-large | TuckER | Hits@1: 0.244 Hits@10: 0.430 Hits@3: 0.3395 MRR: 0.309 |
| link-prediction-on-codex-large | TransE | Hits@1: 0.116 Hits@10: 0.317 Hits@3: 0.2188 MRR: 0.187 |
| link-prediction-on-codex-medium | RESCAL | Hits@1: 0.239 Hits@10: 0.464 Hits@3: 0.3551 MRR: 0.317 |
| link-prediction-on-codex-medium | TuckER | Hits@1: 0.223 Hits@10: 0.454 Hits@3: 0.3363 MRR: 0.328 |
| link-prediction-on-codex-medium | ConvE | Hits@1: 0.262 Hits@10: 0.476 Hits@3: 0.3701 MRR: 0.318 |
| link-prediction-on-codex-medium | ComplEx | Hits@1: 0.244 Hits@10: 0.456 Hits@3: 0.3477 MRR: 0.337 |
| link-prediction-on-codex-medium | TransE | Hits@1: 0.259 Hits@10: 0.458 Hits@3: 0.3599 MRR: 0.303 |