
摘要
神经序列到序列模型为抽象文本摘要(即不限于从原始文本中选择和重新排列段落)提供了一种可行的新方法。然而,这些模型存在两个缺点:一是容易不准确地重现事实细节,二是倾向于重复自身内容。在本研究中,我们提出了一种新颖的架构,通过两种正交方式增强标准的序列到序列注意力模型。首先,我们使用一种混合指针生成网络,该网络可以通过指针机制从源文本中复制单词,从而有助于准确地再现信息,同时保留通过生成器产生新词的能力。其次,我们利用覆盖机制来跟踪已总结的内容,这可以减少重复现象。我们将该模型应用于CNN/Daily Mail的摘要任务中,在至少2个ROUGE分数上超过了当前的抽象摘要最佳水平。
代码仓库
steph1793/Pointer_Transformer_Generator
tf
GitHub 中提及
jiminsun/pointer-generator
pytorch
GitHub 中提及
daphne12345/SummarizationRadiologyReports
tf
GitHub 中提及
Iwontbecreative/Abstractive-summarization-OpenNMT
pytorch
GitHub 中提及
prashanth41/text-summarization
tf
GitHub 中提及
lvyufeng/pointer_summarizer_mindspore
mindspore
GitHub 中提及
sanjeevkrn/teaser_generate
tf
GitHub 中提及
Ujwal0404/Pointer-Generator-Network
tf
GitHub 中提及
Paleontolog/pointer_summarizer
pytorch
GitHub 中提及
ishtoo1/Text-Summarization-using-Attention
pytorch
GitHub 中提及
sblayush/Tensorflow-Attention
tf
GitHub 中提及
zide05/pointer-gen-fastnlp
pytorch
GitHub 中提及
kukrishna/pointer-generator-pytorch-allennlp
pytorch
GitHub 中提及
krystalan/k-sportssum
pytorch
GitHub 中提及
WolfNiu/AdversarialDialogue
tf
GitHub 中提及
rutikasb/abstractive-text-summarization
tf
GitHub 中提及
mythicalhacker/Text-Summarization
tf
GitHub 中提及
ishtoo1/Text-Summarization-using-Pointer-Generator-Model
pytorch
GitHub 中提及
wyu97/permgen
pytorch
GitHub 中提及
abisee/cnn-dailymail
tf
GitHub 中提及
steph1793/Pointer_Generator_Summarizer
tf
GitHub 中提及
rohithreddy024/Text-Summarizer-Pytorch
pytorch
GitHub 中提及
becxer/pointer-generator
tf
GitHub 中提及
AIKevin/Pointer_Generator_Summarizer
tf
GitHub 中提及
danchern97/pointer_generator_pytorch
pytorch
GitHub 中提及
abisee/pointer-generator
官方
tf
GitHub 中提及
apexmeister/PGN_pytorch_lightning
pytorch
GitHub 中提及
sblayush/summarization
tf
GitHub 中提及
atulkum/pointer_summarizer
pytorch
GitHub 中提及
NirmalenduPrakash/DocumentSummarizer
pytorch
GitHub 中提及
threelittlemonkeys/pointer-network-pytorch
pytorch
GitHub 中提及
ArvindSridhar/AbstractiveTextSummarization
tf
GitHub 中提及
NirmalenduPrakash/Document-Summarizer
pytorch
GitHub 中提及
Kumar-Tarun/summarization
pytorch
GitHub 中提及
AndreyKolomiets/News_Headline_Generation
tf
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| abstractive-text-summarization-on-cnn-daily | PTGEN + Coverage | ROUGE-1: 39.53 ROUGE-2: 17.28 ROUGE-L: 36.38 |
| abstractive-text-summarization-on-cnn-daily | PTGEN + Coverage | ROUGE-1: 39.53 ROUGE-2: 17.28 ROUGE-L: 36.38 |
| abstractive-text-summarization-on-cnn-daily | Pointer-Generator + Coverage | ROUGE-1: 39.53 ROUGE-2: 17.28 |
| document-summarization-on-cnn-daily-mail | Lead-3 | ROUGE-1: 40.34 ROUGE-2: 17.70 ROUGE-L: 36.57 |
| extractive-document-summarization-on-cnn | Lead-3 baseline | ROUGE-1: 40.34 ROUGE-2: 17.70 ROUGE-L: 36.57 |
| text-summarization-on-arxiv | Pntr-Gen-Seq2Seq | ROUGE-1: 32.06 |
| text-summarization-on-pubmed-1 | Pntr-Gen-Seq2Seq | ROUGE-1: 35.86 |