
摘要
抽象性摘要生成是文档摘要研究的终极目标,但由于此前文本生成技术尚不成熟,该方向长期未受到充分关注。近年来,基于神经网络模型的抽象性句子摘要取得了显著进展。然而,抽象性文档摘要的研究仍处于初级阶段,其在基准数据集上的评估结果相较于抽取式方法仍显逊色。本文系统分析了神经网络抽象性文档摘要面临的主要挑战,并在序列到序列框架中提出了一种新颖的基于图的注意力机制。该方法的核心思想在于捕捉摘要生成中的显著性因素,而这一关键问题此前在相关研究中被忽视。实验结果表明,所提模型相较于以往的神经抽象摘要模型取得了显著性能提升。此外,该数据驱动的抽象摘要方法在性能上已可与当前最先进的抽取式方法相媲美。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-summarization-on-cnn-daily-mail-2 | Tan et al. | ROUGE-1: 38.1 ROUGE-2: 13.9 ROUGE-L: 34.0 |