3 个月前

RESDSQL:面向文本到SQL的模式链接与骨架解析解耦方法

RESDSQL:面向文本到SQL的模式链接与骨架解析解耦方法

摘要

近年来,文本到SQL(Text-to-SQL)任务中最具代表性的方法之一是基于预训练语言模型的方法。由于SQL查询具有特定的结构特性,传统的序列到序列(seq2seq)模型需同时承担解析模式项(即表名和列名)与查询骨架(即SQL关键字)的双重任务。这种耦合的目标设计显著增加了正确生成SQL查询的难度,尤其是在涉及大量模式项和复杂逻辑运算符的情况下。本文提出了一种增强排序的编码与骨架感知的解码框架,旨在解耦模式项链接与查询骨架解析过程。具体而言,针对seq2seq编码器-解码器模型,其编码器仅注入与当前查询最相关的模式项,而非全部无序的模式项,从而有效降低SQL解析过程中的模式链接负担;同时,解码器采用分步生成策略:先生成查询骨架,再生成完整的SQL语句,该机制能够隐式地约束SQL语法结构,提升生成准确性。我们在Spider数据集及其三个鲁棒性变体——Spider-DK、Spider-Syn和Spider-Realistic上对所提框架进行了评估。实验结果表明,该框架在性能与鲁棒性方面均表现出色。相关代码已开源,地址为:https://github.com/RUCKBReasoning/RESDSQL。

代码仓库

ruckbreasoning/resdsql
官方
pytorch
GitHub 中提及

基准测试

基准方法指标
semantic-parsing-on-spiderRESDSQL-3B + NatSQL
Accuracy: 84.1
text-to-sql-on-spiderRESDSQL-3B + NatSQL
Exact Match Accuracy (Dev): 80.5
Exact Match Accuracy (Test): 72.0
Execution Accuracy (Dev): 84.1
Execution Accuracy (Test): 79.9

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
RESDSQL:面向文本到SQL的模式链接与骨架解析解耦方法 | 论文 | HyperAI超神经