3 个月前

破解谜题:基于子目标的演示学习在形式化定理证明中的应用

破解谜题:基于子目标的演示学习在形式化定理证明中的应用

摘要

大型语言模型(Large Language Models, LLMs)在形式化定理证明领域展现出极具前景的研究方向。然而,这些模型在演示范例的格式设计与组织结构方面的充分应用,仍是一个尚未得到深入探索的课题。为提升LLMs在该任务中的有效性,本文提出一种基于子目标(subgoal-based)的演示学习框架,包含两个核心组成部分:首先,借鉴强化学习与机器人学领域中关于子目标学习的理论洞见,我们为每个演示示例构建独立的子目标,并依据相关子目标学习理论对这些子目标进行优化与精炼;其次,我们结合扩散模型(diffusion models)的最新进展,实现对演示范例最优组织结构的预测,同时有效解决演示组织中长期存在的两个复杂问题:子集选择与顺序确定。通过融合基于子目标的学习方法,我们在miniF2F基准测试上将当前主流的证明准确率从38.9%提升至44.3%。进一步引入扩散模型进行演示组织优化,可使准确率再提升至45.5%,相较于长期占据主导地位的最先进方法,实现采样效率提升达5倍。相关代码已公开,地址为:\url{https://github.com/HKUNLP/subgoal-theorem-prover}。

基准测试

基准方法指标
automated-theorem-proving-on-minif2f-testDecomposing the Enigma
ITP: Isabelle
Pass@100: 45.5
cumulative: 45.5

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
破解谜题:基于子目标的演示学习在形式化定理证明中的应用 | 论文 | HyperAI超神经