6 个月前

摘要

将结构化数据转化为自然语言描述已成为一项具有挑战性的任务，被称为“数据到文本”（data-to-text）。这类结构通常包含多个元素及其属性。目前大多数方法依赖于编码器-解码器的翻译框架，将数据元素线性化为序列，但这会丢失数据中蕴含的大部分结构信息。在本研究中，我们提出一种层次化模型，能够在元素层面和结构层面同时编码数据结构，从而克服上述局限性。在RotoWire数据集上的实验结果表明，该模型在定性和定量评估指标上均表现出优异性能。

源 PDF