4 个月前

混合内容选择以实现多样化的序列生成

混合内容选择以实现多样化的序列生成

摘要

生成多样化的序列在许多自然语言处理(NLP)应用中非常重要,例如问题生成或摘要生成,这些应用展示了源序列与目标序列之间语义上的多对一关系。我们提出了一种方法,通过一个通用的即插即用模块(称为SELECTOR)来显式地分离多样化与生成过程,该模块可以包裹并指导现有的编码器-解码器模型。多样化阶段利用专家混合模型对源序列进行不同二进制掩码的采样,以选择不同的内容。生成阶段则基于从源序列中选择的每部分内容,使用标准的编码器-解码器模型进行生成。由于离散采样的不可微分性质以及缺乏二进制掩码的真实标签,我们采用了一个真实掩码的代理,并采用了随机硬期望最大化(stochastic hard-EM)算法进行训练。在问题生成(SQuAD)和抽象摘要生成(CNN-DM)任务中,我们的方法在准确性、多样性和训练效率方面均表现出显著改进,包括在这两个数据集上达到了最先进的Top-1准确率,在Top-5准确率上提高了6%,并且比最先进的模型快3.7倍完成训练。我们的代码已公开发布在https://github.com/clovaai/FocusSeq2Seq。

代码仓库

clovaai/FocusSeq2Seq
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
abstractive-text-summarization-on-cnn-dailySelector & Pointer-Generator
ROUGE-1: 41.72
ROUGE-2: 18.74
ROUGE-L: 38.79
document-summarization-on-cnn-daily-mailSelector+Pointer Generator
ROUGE-1: 41.72
ROUGE-2: 18.74
ROUGE-L: 38.79
question-generation-on-squad11Selector & NQG++
BLEU-4: 15.874

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
混合内容选择以实现多样化的序列生成 | 论文 | HyperAI超神经