3 个月前

SummaReranker:一种用于抽象摘要的多任务专家混合重排序框架

SummaReranker:一种用于抽象摘要的多任务专家混合重排序框架

摘要

序列到序列神经网络在抽取式摘要任务中近年来取得了显著进展,尤其通过在下游数据集上微调大规模预训练语言模型实现。这类模型通常采用束搜索(beam search)进行解码,以生成唯一的摘要。然而,搜索空间极为庞大,且受暴露偏差(exposure bias)影响,此类解码方式并非最优。本文提出,可直接训练一个第二阶段模型,对一组候选摘要进行重排序。我们提出的专家混合模型 SummaReranker 能够学习选择更优的摘要候选,从而持续提升基础模型的性能。在以 PEGASUS 为基础模型的前提下,我们在 CNN-DailyMail 数据集上将 ROUGE 分数提升 5.44%(ROUGE-1 达 47.16),在 XSum 数据集上提升 1.31%(ROUGE-1 达 48.12),在 Reddit TIFU 数据集上提升 9.34%(ROUGE-1 达 29.83),达到当前最先进的性能水平。相关代码与模型检查点将公开于 https://github.com/ntunlp/SummaReranker。

代码仓库

ntunlp/summareranker
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
abstractive-text-summarization-on-cnn-dailyPEGASUS + SummaReranker
ROUGE-1: 47.16
ROUGE-2: 22.61
ROUGE-L: 43.87
document-summarization-on-cnn-daily-mailPEGASUS + SummaReranker
ROUGE-1: 47.16
ROUGE-2: 22.55
ROUGE-L: 43.87
text-summarization-on-reddit-tifuPEGASUS + SummaReranker
ROUGE-1: 29.83
ROUGE-2: 9.5
ROUGE-L: 23.47
text-summarization-on-x-sumPEGASUS + SummaReranker
ROUGE-1: 48.12
ROUGE-2: 24.95
ROUGE-L: 40.00

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SummaReranker:一种用于抽象摘要的多任务专家混合重排序框架 | 论文 | HyperAI超神经