6 个月前

自然语言处理

James Xu Zhao Yuxi Xie Kenji Kawaguchi Junxian He Michael Qizhe Xie

摘要

思维链（Chain-of-Thought, CoT）与程序辅助语言模型（Program-Aided Language Models, PAL）代表了两种不同的推理范式，各具优势。CoT 采用自然语言进行推理，具有高度的灵活性与可解释性；而 PAL 则借助编程语言，能够实现更为结构化和严谨的逻辑推导。本文提出一种模型选择机制，通过引入大语言模型（Large Language Model, LLM）动态决策在 CoT 与 PAL 之间进行选择，从而融合二者的优势。理论分析表明该方法具备可行性，实验结果进一步验证了其有效性。在 Codex、ChatGPT 与 GPT-4 上，所提出的方法在八个推理数据集上均实现了显著的性能提升。此外，该方法与自一致性（self-consistency）策略具有良好的互补性：二者结合后不仅进一步提升了性能，还大幅降低了计算开销。值得一提的是，我们在 GSM8K 和 SVAMP 数据集上取得了新的最先进（state-of-the-art）结果，准确率分别达到 96.8% 和 93.7%。相关代码、数据及提示模板已开源，详见：https://github.com/XuZhao0/Model-Selection-Reasoning。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

James Xu Zhao Yuxi Xie Kenji Kawaguchi Junxian He Michael Qizhe Xie

摘要

思维链（Chain-of-Thought, CoT）与程序辅助语言模型（Program-Aided Language Models, PAL）代表了两种不同的推理范式，各具优势。CoT 采用自然语言进行推理，具有高度的灵活性与可解释性；而 PAL 则借助编程语言，能够实现更为结构化和严谨的逻辑推导。本文提出一种模型选择机制，通过引入大语言模型（Large Language Model, LLM）动态决策在 CoT 与 PAL 之间进行选择，从而融合二者的优势。理论分析表明该方法具备可行性，实验结果进一步验证了其有效性。在 Codex、ChatGPT 与 GPT-4 上，所提出的方法在八个推理数据集上均实现了显著的性能提升。此外，该方法与自一致性（self-consistency）策略具有良好的互补性：二者结合后不仅进一步提升了性能，还大幅降低了计算开销。值得一提的是，我们在 GSM8K 和 SVAMP 数据集上取得了新的最先进（state-of-the-art）结果，准确率分别达到 96.8% 和 93.7%。相关代码、数据及提示模板已开源，详见：https://github.com/XuZhao0/Model-Selection-Reasoning。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供