
摘要
本文旨在解决基于RNN的编码器-解码器模型中常见的冗余重复生成问题。我们的基本思路是在编码器中联合估计每个目标词汇的上限频率,并在解码器中根据这一估计来控制输出词汇。该方法在强大的基于RNN的编码器-解码器基准模型上表现出显著的改进,并在抽象摘要生成基准测试中取得了最佳结果。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-summarization-on-duc-2004-task-1 | EndDec+WFE | ROUGE-1: 32.28 ROUGE-2: 10.54 ROUGE-L: 27.8 |
| text-summarization-on-gigaword | EndDec+WFE | ROUGE-1: 36.30 ROUGE-2: 17.31 ROUGE-L: 33.88 |