
摘要
我们提出了一种名为检索-转换-校验(Retriever-Transducer-Checker,简称 ReTraCk)的神经语义解析框架,用于大规模知识库问答(KBQA)。ReTraCk 采用模块化设计,具有高度灵活性。该框架包含三个核心组件:检索器(retriever)用于高效获取相关知识库条目,转换器(transducer)用于生成具有语法正确性保障的逻辑形式,以及校验器(checker)用于优化转换过程。在 GrailQA 排行榜上,ReTraCk 在整体性能上位列第一,并在 WebQuestionsSP 这一典型基准测试中取得了极具竞争力的表现。此外,我们的系统能够实现与用户的实时交互,充分体现了所提出框架的高效性。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| knowledge-base-question-answering-on-1 | ReTraCk Oracle EL | F1: 74.7 Hits@1: 74.6 |
| knowledge-base-question-answering-on-1 | ReTraCk | F1: 71 Hits@1: 71.6 |
| knowledge-base-question-answering-on-grailqa | ReTraCk | Compositional EM: 61.5 Compositional F1: 70.9 I.I.D. EM: 84.4 I.I.D. F1: 87.5 Overall EM: 58.1 Overall F1: 65.3 Zero-shot EM: 44.6 Zero-shot F1: 52.5 |