
摘要
对话具有固有的多对一属性,这意味着在相同的对话上下文中可以有多个合适的回应。在任务导向型对话中,这一属性导致了完成任务时存在不同的有效对话策略。然而,现有的所有任务导向型对话生成方法都未考虑这一属性。我们提出了一种多动作数据增强(MADA)框架,利用多对一属性生成多样化的合适对话回应。具体而言,我们首先使用对话状态来总结对话历史,然后发现从每个对话状态到其不同有效系统动作的所有可能映射。在对话系统训练过程中,我们将当前的对话状态映射到前一过程中发现的所有有效系统动作,以创建额外的状态-动作对。通过整合这些额外的对,对话策略学习到了一个平衡的动作分布,这进一步指导了对话模型生成多样化的回应。实验结果表明,所提出的框架能够持续提高对话策略的多样性,并且提升了回应的多样性和适宜性。我们的模型在MultiWOZ上取得了最先进的结果。
代码仓库
bepoetree/mttod
pytorch
GitHub 中提及
whatissimondoing/his-dialog
pytorch
GitHub 中提及
https://gitlab.com/ucdavisnlp/damd-multiwoz
官方
pytorch
GitHub 中提及
TonyNemo/UBAR-MultiWOZ
pytorch
GitHub 中提及
yunhaoli1995/MAMD-TOD
pytorch
GitHub 中提及
jasonyux/krls
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| end-to-end-dialogue-modelling-on-multiwoz-2-0 | DAMD | BLEU: 18.6 MultiWOZ (Inform): 76.3 MultiWOZ (Success): 60.4 |