4 个月前

使用序列到序列RNN及更高级方法的抽象文本摘要生成

使用序列到序列RNN及更高级方法的抽象文本摘要生成

摘要

在本研究中,我们使用注意力机制编码器-解码器循环神经网络(Attentional Encoder-Decoder Recurrent Neural Networks)对抽象文本摘要进行建模,并展示了该模型在两个不同语料库上达到了最先进的性能。我们提出了一系列新颖的模型,旨在解决基本架构未能充分建模的摘要生成中的关键问题,如关键词建模、捕捉句子到单词的层次结构以及生成训练时罕见或未见过的单词。我们的研究表明,许多所提出的模型进一步提升了性能。此外,我们还提出了一个新的多句摘要数据集,并为后续研究建立了性能基准。

基准测试

基准方法指标
abstractive-text-summarization-on-cnn-dailyLEAD-3
ROUGE-1: 40.42
ROUGE-2: 17.62
ROUGE-L: 36.67
text-summarization-on-cnn-daily-mail-2words-lvt2k-temp-att
ROUGE-1: 35.46
ROUGE-2: 13.30
ROUGE-L: 32.65
text-summarization-on-duc-2004-task-1words-lvt5k-1sent
ROUGE-1: 28.61
ROUGE-2: 9.42
ROUGE-L: 25.24
text-summarization-on-gigawordwords-lvt5k-1sent
ROUGE-1: 36.4
ROUGE-2: 17.7
ROUGE-L: 33.71

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
使用序列到序列RNN及更高级方法的抽象文本摘要生成 | 论文 | HyperAI超神经