
摘要
我们介绍了SummaRuNNer,这是一种基于循环神经网络(RNN)的序列模型,用于文档的抽取式摘要生成,并展示了其性能优于或可与当前最先进的方法相媲美。我们的模型还具有很高的可解释性优势,因为它可以按抽象特征(如信息含量、显著性和新颖性)对预测结果进行可视化分解。此外,我们的工作还提出了一个新的贡献,即通过抽象训练来训练我们的抽取式模型,该方法仅需依赖人工生成的参考摘要,从而消除了对句子级抽取标签的需求。
代码仓库
no-execution/Summa_label
pytorch
GitHub 中提及
amagooda/SummaRuNNer_coattention
pytorch
GitHub 中提及
kedz/nnsum
pytorch
GitHub 中提及
dennlinger/summaries
GitHub 中提及
kotyukov/huaweiNLP
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-summarization-on-cnn-daily-mail-2 | SummaRuNNer | ROUGE-1: 39.6 ROUGE-2: 16.2 ROUGE-L: 35.3 |
| text-summarization-on-cnn-daily-mail-2 | Lead-3 baseline | ROUGE-1: 39.2 ROUGE-2: 15.7 ROUGE-L: 35.5 |