3 个月前

基于变分序贯规划的数据到文本生成

基于变分序贯规划的数据到文本生成

摘要

我们研究数据到文本生成任务,该任务旨在从非语言输入生成文本输出。本文重点关注长文本生成,即包含多个段落的文档生成,并提出一种引入规划组件的神经模型,该组件负责以连贯且有意义的方式组织高层信息。我们采用结构化变分模型,逐步推断隐式规划方案,同时将规划与生成步骤交替进行。文本生成过程基于先前的变分决策以及已生成的文本内容进行条件建模。在两个数据到文本基准数据集(RotoWire 和 MLB)上的实验结果表明,我们的模型显著优于多个强基线方法,并在训练数据有限(例如仅几百个样本)的情况下仍表现出良好的样本效率。

代码仓库

ratishsp/data2text-seq-plan-py
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
data-to-text-generation-on-mlb-datasetSeqPlan
Precision: 95.9
count: 28.9
data-to-text-generation-on-mlb-dataset-1SeqPlan
Precision: 43.3
Recall: 53.5
data-to-text-generation-on-mlb-dataset-2SeqPlan
BLEU: 14.29
data-to-text-generation-on-mlb-dataset-3SeqPlan
DLD: 22.7
data-to-text-generation-on-rotowire-relationSeqPlan
Precision: 97.6
count: 46.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于变分序贯规划的数据到文本生成 | 论文 | HyperAI超神经