4 个月前

Search-o1: 增强型代理搜索大型推理模型

Search-o1: 增强型代理搜索大型推理模型

摘要

大型推理模型(LRMs)如OpenAI-o1通过大规模强化学习展示了令人印象深刻的长步骤推理能力。然而,这些扩展的推理过程常常因知识不足而受到困扰,导致频繁的不确定性及潜在错误。为了解决这一局限性,我们引入了Search-o1框架,该框架通过代理检索增强生成(RAG)机制和文档内推理模块来提升LRMs的性能。Search-o1将代理搜索工作流程整合到推理过程中,当LRMs遇到不确定的知识点时,能够动态检索外部知识。此外,由于检索到的文档通常较为冗长,我们设计了一个独立的文档内推理模块,在将信息注入推理链之前对其进行深入分析,以减少噪声并保持连贯的推理流程。在科学、数学和编程领域的复杂推理任务以及六个开放域问答基准测试中进行的广泛实验表明,Search-o1表现出强大的性能。这种方法增强了LRMs在复杂推理任务中的可信度和适用性,为更加可靠和多样的智能系统铺平了道路。代码可在https://github.com/sunnynexus/Search-o1获取。

代码仓库

sunnynexus/search-o1
官方
GitHub 中提及

基准测试

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Search-o1: 增强型代理搜索大型推理模型 | 论文 | HyperAI超神经