
摘要
本文提出了一种基于ChatGPT的零样本Text-to-SQL方法,命名为C3,在Spider数据集的预留测试集上实现了82.3%的执行准确率,成为Spider Challenge任务中性能最优的零样本Text-to-SQL方法。C3由三个核心组件构成:清晰提示(Clear Prompting, CP)、基于提示的校准(Calibration with Hints, CH)以及一致输出(Consistent Output, CO),分别对应模型输入、模型偏差和模型输出三个层面。该方法为零样本Text-to-SQL任务提供了一套系统化的解决方案。通过大量实验,充分验证了所提出方法的有效性与高效性。
代码仓库
bigbigwatermalon/c3sql
官方
pytorch
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| text-to-sql-on-spider | C3 + ChatGPT + Zero-Shot | Execution Accuracy (Dev): 81.8 Execution Accuracy (Test): 82.3 |