Arman Cohan; Franck Dernoncourt; Doo Soon Kim; Trung Bui; Seokhwan Kim; Walter Chang; Nazli Goharian

摘要
神经抽象概括模型在总结相对较短的文档方面已经取得了令人鼓舞的结果。我们提出了一种用于单个较长形式文档(例如,研究论文)的抽象概括的首个模型。我们的方法包括一个新的层次编码器,该编码器建模了文档的篇章结构,以及一个注意篇章结构的解码器来生成摘要。在两个大规模科学论文数据集上的实证结果表明,我们的模型显著优于现有最先进模型。
代码仓库
acohan/long-summarization
官方
tf
GitHub 中提及
AlexGidiotis/DANCER-summ
pytorch
GitHub 中提及
tongbao96/code-for-sfr-as
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-summarization-on-arxiv | Discourse | ROUGE-1: 35.80 |
| text-summarization-on-pubmed-1 | Discourse | ROUGE-1: 38.93 |
| unsupervised-extractive-summarization-on | SumBasic | ROUGE-1: 29.47 ROUGE-2: 6.95 ROUGE-L: 26.30 |
| unsupervised-extractive-summarization-on | LSA | ROUGE-1: 29.91 ROUGE-2: 7.42 ROUGE-L: 25.67 |
| unsupervised-extractive-summarization-on | LexRank | ROUGE-1: 33.85 ROUGE-2: 10.73 ROUGE-L: 28.99 |
| unsupervised-extractive-summarization-on-1 | LexRank | ROUGE-1: 39.19 ROUGE-2: 13.89 ROUGE-L: 34.59 |
| unsupervised-extractive-summarization-on-1 | SumBasic | ROUGE-1: 37.15 ROUGE-2: 11.36 ROUGE-L: 33.43 |
| unsupervised-extractive-summarization-on-1 | LSA | ROUGE-1: 33.89 ROUGE-2: 9.93 ROUGE-L: 29.70 |