3 个月前

基于内容增强的BERT文本到SQL生成

基于内容增强的BERT文本到SQL生成

摘要

我们提出了一种简单有效的方法,利用表格内容提升基于BERT的模型在文本到SQL(text-to-SQL)任务中的性能。基于观察发现,部分表格内容中的词汇与问题字符串中的词语存在匹配关系,同时部分表格标题也与问题中的词语相匹配,我们为此设计了两种额外的特征向量,并将其编码输入深度模型中。该方法在测试阶段同样具有优势,因为训练与测试阶段所使用的表格内容几乎保持一致,从而提升了模型推理效率。我们在WikiSQL数据集上对模型进行了测试,结果表明,相较于基于BERT的基线模型,我们的方法在逻辑形式准确率和执行准确率上分别提升了3.7%,并达到了当前最优(state-of-the-art)水平。

代码仓库

基准测试

基准方法指标
code-generation-on-wikisqlNL2SQL-RULE
Exact Match Accuracy: 83.7
Execution Accuracy: 89.2
semantic-parsing-on-wikisql-1NL2SQL-BERT
Accuracy: 89

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于内容增强的BERT文本到SQL生成 | 论文 | HyperAI超神经