Rajarshi DasManzil ZaheerDung ThaiAmeya GodboleEthan PerezJay-Yoon LeeLizhen TanLazaros PolymenakosAndrew McCallum

摘要
在面对复杂问题时,从零开始求解往往极具挑战性,但如果能够参考具有相似结构且已有解决方案的过往案例,则问题将变得相对容易——这一范式被称为基于案例的推理(Case-Based Reasoning, CBR)。本文提出了一种神经符号融合的CBR方法(CBR-KBQA),用于在大规模知识库上进行问答任务。CBR-KBQA由一个非参数化记忆模块和一个参数化模型构成:前者用于存储案例(即问题及其对应的逻辑形式),后者则通过检索与新问题相关的历史案例,生成该问题的逻辑形式。在包含复杂问题的多个知识库问答(KBQA)数据集上,CBR-KBQA取得了具有竞争力的性能表现。例如,在ComplexWebQuestions数据集上,其准确率比当前最优方法高出11%。此外,我们进一步证明,CBR-KBQA能够在无需任何额外训练的情况下,有效利用新案例:仅需在案例记忆中引入少量人工标注的示例,该模型即可成功生成包含未见过的知识库实体和关系的逻辑形式。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| knowledge-base-question-answering-on | QGG | Accuracy: 44.1 |
| knowledge-base-question-answering-on | PullNet | Accuracy: 45.9 |
| knowledge-base-question-answering-on | CBR-KBQA | Accuracy: 70.4 |
| semantic-parsing-on-webquestionssp | CBR-KBQA | Accuracy: 70 |