
摘要
我们将人类语言理解形式化为一个结构化预测任务,其中输出为一个部分有序集(poset)。现有的编码器-解码器架构未能充分考虑语义的poset结构,因而导致组合泛化能力较差。本文提出一种新型的层次化poset解码范式,以提升语言理解中的组合泛化能力。直观上,该范式具有以下优势:(1)在语义层面强制实现部分置换不变性(partial permutation invariance),从而避免对特定排序信息的过拟合;(2)层次化机制能够有效捕捉poset的高层结构。我们在Compositional Freebase Questions(CFQ)数据集上对所提出的解码器进行了评估,该数据集是一个大规模且贴近真实场景的自然语言问答数据集,专门用于衡量组合泛化性能。实验结果表明,该方法显著优于现有的解码器模型。
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semantic-parsing-on-cfq | Hierarchical Poset Decoding | Exact Match: 69.0 |