3 个月前

思维链提示在大型语言模型中激发推理能力

思维链提示在大型语言模型中激发推理能力

摘要

我们探讨了通过生成思维链——即一系列中间推理步骤——如何显著提升大型语言模型执行复杂推理的能力。特别地,我们展示了在足够大的语言模型中,仅通过一种称为“思维链提示”(chain of thought prompting)的简单方法,便可自然地涌现出此类推理能力:即在提示中提供少量思维链示范作为示例。在三个大型语言模型上的实验表明,思维链提示显著提升了模型在算术推理、常识推理和符号推理等多种任务上的表现。其实际性能提升尤为显著:例如,仅使用八个思维链示例对一个参数规模达5400亿的语言模型进行提示,即可在数学应用题基准测试GSM8K上达到当前最优水平,甚至超越经过微调且配备验证器的GPT-3模型。

代码仓库

thudm/chatglm2-6b
pytorch
GitHub 中提及
thu-keg/korc
pytorch
GitHub 中提及
imnearth/coat
GitHub 中提及
mrlab-ai/NL2Plan
GitHub 中提及
scofield7419/thor-isa
pytorch
GitHub 中提及
srush/minichain
pytorch
GitHub 中提及
TianduoWang/MsAT
pytorch
GitHub 中提及
rlqja1107/torch-LLM4SGG
pytorch
GitHub 中提及
sunlab-osu/understanding-cot
pytorch
GitHub 中提及
infini-ai-lab/sirius
pytorch
GitHub 中提及
yinzhangyue/eot
pytorch
GitHub 中提及
microsoft/guidance
GitHub 中提及
nicolay-r/thor-ecac
pytorch
GitHub 中提及
lupantech/chameleon-llm
GitHub 中提及
guidance-ai/guidance
GitHub 中提及
yinzhangyue/AoR
GitHub 中提及

基准测试

基准方法指标
common-sense-reasoning-on-commonsenseqaChain of thought ASDiv
Accuracy: 28.6
question-answering-on-webquestionsCoT
EM: 42.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
思维链提示在大型语言模型中激发推理能力 | 论文 | HyperAI超神经