
摘要
响应选择在构建基于检索的对话系统中发挥着至关重要的作用。尽管响应选择本质上是一个学习排序问题,但大多数先前的研究采取了点对点的观点,为该任务训练二元分类器:每个响应候选被标记为相关(1)或不相关(0)。一方面,这种形式化方法可能由于忽略了响应质量的多样性而次优;另一方面,为学习排序标注灰度数据可能成本高昂且极具挑战性。在这项工作中,我们展示了无需人工努力即可自动构建灰度数据的方法。我们的方法利用现成的响应检索模型和响应生成模型作为自动灰度数据生成器。通过构建的灰度数据,我们提出了多级排序目标进行训练,这可以(1)教导匹配模型捕捉更细粒度的上下文-响应相关性差异,并(2)减少训练集和测试集在干扰项强度方面的差异。我们的方法简单、有效且通用。在三个基准数据集和四个最先进的匹配模型上的实验表明,所提出的方法带来了显著且一致的性能提升。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| conversational-response-selection-on-e | G-MSN | R10@1: 0.613 R10@2: 0.786 R10@5: 0.964 |