3 个月前

思维树:基于大语言模型的审慎问题解决

思维树:基于大语言模型的审慎问题解决

摘要

语言模型正被越来越多地应用于各类通用问题求解任务,但在推理过程中仍受限于逐标记、从左到右的决策机制。这一局限使得模型在需要探索、战略前瞻,或初始决策起关键作用的任务中表现不佳。为克服这些挑战,我们提出一种全新的语言模型推理框架——思维树(Tree of Thoughts, ToT)。该框架在广受欢迎的“思维链”(Chain of Thought)提示方法基础上进行扩展,支持对连贯文本单元(即“思维”)进行探索,这些思维作为问题求解过程中的中间步骤,构成更灵活的推理路径。ToT 使语言模型能够通过考虑多种不同的推理路径,并对自身选择进行自我评估,从而做出更审慎的决策。在必要时,模型可进行前瞻判断或回溯调整,以实现全局最优选择。实验结果表明,ToT 在三项需要复杂规划或搜索能力的新任务上显著提升了语言模型的问题求解能力:24点游戏、创意写作和迷你填字游戏。例如,在24点游戏中,仅使用思维链提示的 GPT-4 模型仅能解决 4% 的任务,而我们的方法成功率达 74%。相关完整提示代码仓库已开源:https://github.com/princeton-nlp/tree-of-thought-llm。

基准测试

基准方法指标
arithmetic-reasoning-on-game-of-24Tree of Thoughts (b=5)
Success: 0.74
question-answering-on-truthfulqaToT
EM: 66.6
question-answering-on-webquestionsToT
EM: 26.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
思维树:基于大语言模型的审慎问题解决 | 论文 | HyperAI超神经