
摘要
基于文本提取的摘要生成方法本质上存在局限性,而生成式抽象方法的构建则被证明具有挑战性。在本研究中,我们提出了一种完全数据驱动的抽象句摘要生成方法。该方法采用了一种基于局部注意力机制的模型,该模型在生成摘要中的每个单词时都会根据输入句子进行条件化处理。尽管该模型结构简单,但可以轻松实现端到端训练,并且能够扩展到大量训练数据。与几种强大的基线方法相比,该模型在DUC-2004共享任务中表现出显著的性能提升。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| extractive-text-summarization-on-duc-2004 | Abs | ROUGE-1: 26.55 ROUGE-2: 7.06 ROUGE-L: 22.05 |
| text-summarization-on-duc-2004-task-1 | ABS | ROUGE-L: 22.05 |
| text-summarization-on-duc-2004-task-1 | Abs+ | ROUGE-1: 28.18 ROUGE-2: 8.49 ROUGE-L: 23.81 |
| text-summarization-on-gigaword | Abs+ | ROUGE-1: 31 |
| text-summarization-on-gigaword | Abs | ROUGE-1: 30.88 |