
摘要
图到文本生成的目标是从基于图的数据中生成流畅的文本。在本文中,我们研究了两种最近提出的预训练语言模型(PLM),并分析了不同的任务适应性预训练策略对这些模型在图到文本生成任务中的影响。我们进行了跨三个图领域的研究:意义表示、维基百科知识图谱(KG)和科学知识图谱(KG)。结果显示,BART和T5这两种预训练语言模型达到了新的最先进水平,并且任务适应性预训练策略进一步提高了它们的性能。具体而言,我们在LDC2017T10数据集上报告了49.72的新最先进BLEU分数,在WebNLG数据集上报告了59.70的新最先进BLEU分数,在AGENDA数据集上报告了25.66的新最先进BLEU分数——相对改进率分别为31.8%、4.5%和42.4%。通过广泛的分析,我们确定了预训练语言模型在图到文本任务中取得成功的一些可能原因。我们发现证据表明,这些模型对真实事实的知识有助于它们即使在输入图表示简化为节点和边标签的简单集合时也能表现良好。
代码仓库
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| data-to-text-generation-on-webnlg | T5-small | BLEU: 65.05 |
| data-to-text-generation-on-webnlg-full-1 | T5-large | BLEU: 59.70 |
| kg-to-text-generation-on-agenda | BART-large | BLEU: 23.65 |
| kg-to-text-generation-on-agenda | BART-large+ STA | BLEU: 25.66 |
| kg-to-text-generation-on-webnlg-all | BART_large | BLEU: 54.72 METEOR: 42.23 chrF++: 72.29 |
| kg-to-text-generation-on-webnlg-all | T5_large | BLEU: 59.70 METEOR: 44.18 chrF++: 75.40 |
| kg-to-text-generation-on-webnlg-seen | BART_large | BLEU: 63.45 METEOR: 45.49 chrF++: 77.57 |
| kg-to-text-generation-on-webnlg-seen | T5_large | BLEU: 64.71 METEOR: 45.85 chrF++: 78.29 |
| kg-to-text-generation-on-webnlg-unseen | T5_large | BLEU: 53.67 METEOR: 42.26 chrF++: 72.25 |
| kg-to-text-generation-on-webnlg-unseen | BART_large | BLEU: 43.97 METEOR: 38.61 chrF++: 66.53 |