
摘要
近年来,不完整语句重写任务引起了广泛关注。以往的研究通常将其视为机器翻译任务,并采用带有复制机制的序列到序列架构。本文提出了一种新颖且全面的方法,将该任务重新定义为语义分割问题。这种方法不再从头生成文本,而是引入编辑操作,将问题转化为预测词级编辑矩阵。由于能够捕捉局部和全局信息,我们的方法在多个公开数据集上取得了最先进的性能。此外,我们的方法在推理速度上比标准方法快四倍。
代码仓库
microsoft/ContextualSP
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| dialogue-rewriting-on-multi-rewrite | RUN+BERT | Rewriting F3: 47.7 |
| dialogue-rewriting-on-rewrite | RUN+BERT | ROUGE-L: 93.5 |