
摘要
我们的目标是自动生成关于输入结构化知识库(KB)的自然语言描述。我们基于指针网络构建了生成框架,该网络可以从输入的知识库中复制事实,并引入了两种注意力机制:(i) 槽位感知注意力,用于捕捉槽位类型与其对应槽位值之间的关联;(ii) 新的\emph{表格位置自注意力},用于捕捉相关槽位之间的相互依赖关系。在评估方面,除了包括BLEU、METEOR和ROUGE在内的标准指标外,我们还提出了一种基于知识库重构的评估指标,即从生成的输出中提取一个知识库并与输入的知识库进行比较。此外,我们创建了一个新的数据集,包含106,216对不同实体类型的结构化知识库及其对应的自然语言描述。实验结果表明,我们的方法显著优于现有最先进方法。重构的知识库达到了68.8%至72.6%的F值。
代码仓库
EagleW/Describing_a_Knowledge_Base
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| kb-to-language-generation-on-wikipedia-person | KB-to-Language Generation Model | BLEU: 23.2 METEOR: 23.4 ROUGE: 42.0 |
| table-to-text-generation-on-wikipedia-person | KB-to-Language Generation Model | BLEU: 23.2 METEOR: 42.0 ROUGE: 23.4 |