6 个月前

摘要

语言模型正被越来越多地应用于各类通用问题求解任务，但在推理过程中仍受限于逐标记、从左到右的决策机制。这一局限使得模型在需要探索、战略前瞻，或初始决策起关键作用的任务中表现不佳。为克服这些挑战，我们提出一种全新的语言模型推理框架——思维树（Tree of Thoughts, ToT）。该框架在广受欢迎的“思维链”（Chain of Thought）提示方法基础上进行扩展，支持对连贯文本单元（即“思维”）进行探索，这些思维作为问题求解过程中的中间步骤，构成更灵活的推理路径。ToT 使语言模型能够通过考虑多种不同的推理路径，并对自身选择进行自我评估，从而做出更审慎的决策。在必要时，模型可进行前瞻判断或回溯调整，以实现全局最优选择。实验结果表明，ToT 在三项需要复杂规划或搜索能力的新任务上显著提升了语言模型的问题求解能力：24点游戏、创意写作和迷你填字游戏。例如，在24点游戏中，仅使用思维链提示的 GPT-4 模型仅能解决 4% 的任务，而我们的方法成功率达 74%。相关完整提示代码仓库已开源：https://github.com/princeton-nlp/tree-of-thought-llm。

源 PDF