
摘要
在端到端的任务导向对话系统中,知识库(Knowledge Base, KB)查询一直是一个关键挑战。以往的序列到序列(Seq2Seq)对话生成方法将KB查询视为对整个知识库的注意力机制,但无法保证生成实体之间的一致性。本文提出一种新颖的两步式KB查询框架,以提升生成实体的一致性。在第一步中,受“对话回复通常可由单一KB行支持”这一观察的启发,我们引入了一个知识库检索模块,该模块能够根据对话历史显式地返回最相关的KB行。该检索结果随后被用于过滤Seq2Seq响应生成模型中的无关实体,从而增强输出实体之间的一致性。在第二步中,我们进一步引入注意力机制,聚焦于与当前对话最相关的KB列。为在缺乏标注检索数据的情况下实现模型训练,本文提出了两种可行方法:远监督(distant supervision)与Gumbel-Softmax技术。在两个公开可用的任务导向对话数据集上的实验结果表明,所提模型显著优于基线系统,并能生成具有高度实体一致性的对话响应。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| task-oriented-dialogue-systems-on-kvret | KB-retriever | BLEU: 13.9 Entity F1: 53.7 |