
摘要
从给定的文档集合中自动诱导高质量的知识图谱仍然是人工智能领域的一个具有挑战性的问题。解决这一问题的一种方法是通过在相关任务——槽填充(slot filling)上的进展来实现。在这个任务中,系统被要求根据形式为[实体, 槽位, ?]的查询,利用从给定文档集合的相关段落中提取的证据生成或抽取缺失值以填充槽位。近期的研究尝试以端到端的方式使用基于检索的语言模型来解决这一任务。本文提出了一种新颖的零样本槽填充方法,该方法扩展了密集段落检索技术,引入了困难负例和稳健的训练流程,适用于检索增强生成模型。我们的模型在T-REx和zsRE槽填充数据集上取得了显著改进,不仅提升了段落检索性能,还提高了槽位值生成的质量,并在KILT排行榜上位居榜首。此外,我们展示了系统的鲁棒性及其在新变体TACRED数据集上的领域适应能力,这是通过结合零样本/少样本学习实现的。我们发布了源代码和预训练模型。
代码仓库
ibm/kgi-slot-filling
官方
pytorch
GitHub 中提及
IBM/retrieve-write-slot-filling
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| zero-shot-slot-filling-on-t-rex | DPRNQ | R-Prec: 19.5 R@5: 29.8 |
| zero-shot-slot-filling-on-t-rex | DPRBM25 | R-Prec: 49.02 R@5: 63.34 |
| zero-shot-slot-filling-on-t-rex | DPRDNS+RAG | R-Prec: 74.34 R@5: 82.89 |
| zero-shot-slot-filling-on-t-rex | DPRBM25+RAG | R-Prec: 65.02 R@5: 75.52 |
| zero-shot-slot-filling-on-t-rex | DPRDNS | R-Prec: 42.62 R@5: 55.09 |
| zero-shot-slot-filling-on-t-rex | DPRNQ+RAG | R-Prec: 53.04 R@5: 65.54 |
| zero-shot-slot-filling-on-zsre | DPRNQ+RAG | R-Prec: 68.13 R@5: 79.19 |
| zero-shot-slot-filling-on-zsre | DPRBM25 | R-Prec: 94.55 R@5: 98.17 |
| zero-shot-slot-filling-on-zsre | DPRDNS | R-Prec: 97.53 R@5: 99.3 |
| zero-shot-slot-filling-on-zsre | DPRDNS+RAG | R-Prec: 98.60 R@5: 99.70 |
| zero-shot-slot-filling-on-zsre | DPRNQ | R-Prec: 45.49 R@5: 60.77 |
| zero-shot-slot-filling-on-zsre | DPRBM25+RAG | R-Prec: 96.89 R@5: 98.01 |