
摘要
抽象摘要模型通常从头开始隐式地学习捕捉关键信息。近年来的研究通过引入抽取式摘要作为指导,为抽象式摘要模型提供关键内容的提示,从而提升了模型性能。然而,以抽取式摘要作为指导可能存在过度严格的问题,容易导致信息丢失或引入噪声信号。此外,该方法难以适应具有不同抽象程度的文档。由于关键信息片段的数量及其分布随文档而异,难以设定一个固定的阈值来决定哪些内容应纳入指导信息中。本文提出一种新型摘要方法——SEASON(SaliencE Allocation as Guidance for Abstractive SummarizatiON),该方法采用灵活且可靠的显著性分配作为指导机制,能够有效适应不同抽象程度的文章。在两个基准数据集上的自动评估与人工评估结果表明,所提出的方法具有良好的有效性和可靠性。基于超过一百万篇新闻文章的实证分析进一步揭示,新闻文章句子中存在一种自然的“十五比五十”显著性分布规律,为新闻内容的组织与撰写提供了有价值的启示。
代码仓库
tencent-ailab/season
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| abstractive-text-summarization-on-cnn-daily | SEASON | ROUGE-1: 46.27 ROUGE-2: 22.64 ROUGE-L: 43.08 |