
摘要
时间知识图谱(Temporal Knowledge Graphs, Temporal KGs)通过在知识图谱的每条边中引入时间范围(起始时间和结束时间),对传统知识图谱进行了扩展。尽管知识图谱问答(KGQA)已受到研究界的一定关注,但针对时间知识图谱的问答(Temporal KGQA)仍是一个相对未被充分探索的研究领域。此外,缺乏覆盖广泛的数据集也是制约该领域发展的关键因素之一。为应对这一挑战,我们提出了CRONQUESTIONS——目前已知规模最大的时间知识图谱问答数据集,该数据集在结构复杂度上进行了清晰的分层划分。CRONQUESTIONS的规模较此前唯一已知的数据集扩大了340倍。我们发现,当前多种先进的KGQA方法在该新数据集上的表现远未达到理想水平。为此,我们进一步提出了CRONKGQA,一种基于Transformer架构的解决方案,充分利用了时间知识图谱嵌入技术的最新进展,其性能显著优于所有基线方法,在准确率上相较表现最佳的基线方法提升了120%。通过大量实验,我们深入剖析了CRONKGQA的工作机制,并揭示了在某些场景下仍存在显著提升空间。除数据集外,我们还公开了全部代码,以促进该领域的进一步研究。
代码仓库
apoorvumang/CronKGQA
官方
pytorch
GitHub 中提及
cmavro/tempoqr
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| question-answering-on-complex-cronquestions | CronKGQA | Hits@1: 26.6 |
| question-answering-on-cronquestions | CronKGQA | Hits@1: 64.7 |
| question-answering-on-multitq | CronKGQA | Hits@1: 27.9 Hits@10: 63.5 |
| question-answering-on-timequestions | CRONKGQA | P@1: 39.5 |
| question-answering-on-tiq | CronKGQA | P@1: 0.6 |