
摘要
我们专注于跨域上下文依赖的文本到SQL生成任务。基于相邻自然语言问题通常在语言上存在依赖关系,且其对应的SQL查询往往具有重叠性的观察结果,我们通过编辑前一个预测查询来利用交互历史,以提高生成质量。我们的编辑机制将SQL视为序列,并以简单的方式在标记级别重用生成结果。该机制灵活地修改单个标记,并且对错误传播具有较强的鲁棒性。此外,为了处理不同领域中的复杂表结构,我们采用了一个话语-表编码器和一个表感知解码器,以结合用户话语的上下文和表模式。我们在SParC数据集上评估了我们的方法,并展示了与从零开始生成SQL的最先进基线相比,编辑机制的优势。我们的代码已发布在https://github.com/ryanzhumich/sparc_atis_pytorch。
代码仓库
amolk/editsql
pytorch
GitHub 中提及
hyan5/learning_to_simulate_nl_feedback
pytorch
GitHub 中提及
ryanzhumich/editsql
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| dialogue-state-tracking-on-cosql | Edit-SQL+BERT | interaction match accuracy: 13.7 question match accuracy: 40.8 |
| text-to-sql-on-sparc | EditSQL + BERT | interaction match accuracy: 25.3 question match accuracy: 47.9 |