3 个月前

Hie-BART:基于分层BART的文档摘要

Hie-BART:基于分层BART的文档摘要

摘要

本文提出了一种新型的抽象式文档摘要模型——分层BART(Hie-BART),该模型在BART架构中引入了对文档层次结构(即句子-词级结构)的建模能力。尽管现有的BART模型在文档摘要任务中已达到当前最优性能,但其缺乏句级信息与词级信息之间的交互机制。在机器翻译任务中,通过引入多粒度自注意力机制(Multi-Granularity Self-Attention, MG-SA),神经机器翻译模型的性能得到了显著提升,该机制能够有效捕捉词语与短语之间的关联关系。受此启发,本文提出的Hie-BART模型将MG-SA机制引入BART的编码器中,以更好地建模句子与词之间的层次结构。在CNN/Daily Mail数据集上的实验结果表明,所提出的Hie-BART模型优于多个强基准模型,并相较非层次化的BART模型在ROUGE-L指标上提升了0.23分。

基准测试

基准方法指标
document-summarization-on-cnn-daily-mailHie-BART
ROUGE-1: 44.35
ROUGE-2: 21.37
ROUGE-L: 41.05

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Hie-BART:基于分层BART的文档摘要 | 论文 | HyperAI超神经