4 个月前

DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型

DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型

摘要

在解决将自然语言查询转换为SQL命令这一关键问题时,我们提出了一套紧凑且经过微调的模型以及自修正机制,旨在使非专家用户能够民主化地访问和分析数据,从而减轻与闭源大型语言模型相关的风险。具体而言,我们构建了一个包含超过20,000个样本的Text-to-SQL数据集以及偏好数据集,以提高SQL生成领域的效率。为了进一步确保代码的有效性,我们将一个代码校正器集成到了模型中。我们的系统DataGpt-sql在Spider-dev测试集上达到了87.2%的准确率,展示了我们在文本到SQL转换任务中的解决方案的有效性。我们的代码、数据和模型可在以下网址获取:https://github.com/CainiaoTechAi/datagpt-sql-7b

基准测试

基准方法指标
text-to-sql-on-spiderdatagpt-sql-7B + InvalidSQL-Feedback
Exact Match Accuracy (Dev): 81.6
Execution Accuracy (Dev): 87.2
text-to-sql-on-spiderdatagpt-sql-7B
Exact Match Accuracy (Dev): 80.3
Execution Accuracy (Dev): 84.8

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DataGpt-SQL-7B:一个用于文本到SQL转换的开源语言模型 | 论文 | HyperAI超神经