3 个月前

基于大语言模型的推理自动模型选择

基于大语言模型的推理自动模型选择

摘要

思维链(Chain-of-Thought, CoT)与程序辅助语言模型(Program-Aided Language Models, PAL)代表了两种不同的推理范式,各具优势。CoT 采用自然语言进行推理,具有高度的灵活性与可解释性;而 PAL 则借助编程语言,能够实现更为结构化和严谨的逻辑推导。本文提出一种模型选择机制,通过引入大语言模型(Large Language Model, LLM)动态决策在 CoT 与 PAL 之间进行选择,从而融合二者的优势。理论分析表明该方法具备可行性,实验结果进一步验证了其有效性。在 Codex、ChatGPT 与 GPT-4 上,所提出的方法在八个推理数据集上均实现了显著的性能提升。此外,该方法与自一致性(self-consistency)策略具有良好的互补性:二者结合后不仅进一步提升了性能,还大幅降低了计算开销。值得一提的是,我们在 GSM8K 和 SVAMP 数据集上取得了新的最先进(state-of-the-art)结果,准确率分别达到 96.8% 和 93.7%。相关代码、数据及提示模板已开源,详见:https://github.com/XuZhao0/Model-Selection-Reasoning。

代码仓库

xuzhao0/model-selection-reasoning
官方
GitHub 中提及

基准测试

基准方法指标
math-word-problem-solving-on-svampGPT-4 (Model Selection)
Execution Accuracy: 93.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于大语言模型的推理自动模型选择 | 论文 | HyperAI超神经