6 个月前

监督式微调

软件工程/系统软件/程序设计语言

Jingyao Li Pengguang Chen Bin Xia Hong Xu Jiaya Jia

摘要

大型语言模型（Large Language Models, LLMs）在处理简单编程任务时展现出令人瞩目的能力。然而，当面对更具挑战性的编程问题时，其性能往往显著下降。我们观察到，传统模型通常生成单一的、整体式的代码块，这种模式限制了其在复杂问题求解中的有效性。为克服这一局限，我们提出了模块化思维编码器（Module-of-Thought Coder, MoTCoder）。该方法引入了一种面向模块化思维（MoT）的指令微调框架，旨在引导模型将复杂任务分解为逻辑清晰的子任务与子模块。实验结果表明，通过有意识地构建与利用子模块，MoTCoder 显著提升了生成代码的模块化程度与正确性，在 APPS 数据集上实现了 5.9% 的 pass@1 性能提升，在 CodeContests 数据集上实现了 5.8% 的提升。此外，MoTCoder 在自我纠错能力方面也取得显著进展，超越当前最先进（SOTA）方法达 3.3%。我们进一步分析了问题复杂度与最优模块分解之间的关系，并评估了代码可维护性指数，结果表明 MoTCoder 生成的代码更易于理解与修改，对长期代码维护与演化具有重要价值。相关代码已开源，地址为：https://github.com/dvlab-research/MoTCoder。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

监督式微调

软件工程/系统软件/程序设计语言

Jingyao Li Pengguang Chen Bin Xia Hong Xu Jiaya Jia

摘要

大型语言模型（Large Language Models, LLMs）在处理简单编程任务时展现出令人瞩目的能力。然而，当面对更具挑战性的编程问题时，其性能往往显著下降。我们观察到，传统模型通常生成单一的、整体式的代码块，这种模式限制了其在复杂问题求解中的有效性。为克服这一局限，我们提出了模块化思维编码器（Module-of-Thought Coder, MoTCoder）。该方法引入了一种面向模块化思维（MoT）的指令微调框架，旨在引导模型将复杂任务分解为逻辑清晰的子任务与子模块。实验结果表明，通过有意识地构建与利用子模块，MoTCoder 显著提升了生成代码的模块化程度与正确性，在 APPS 数据集上实现了 5.9% 的 pass@1 性能提升，在 CodeContests 数据集上实现了 5.8% 的提升。此外，MoTCoder 在自我纠错能力方面也取得显著进展，超越当前最先进（SOTA）方法达 3.3%。我们进一步分析了问题复杂度与最优模块分解之间的关系，并评估了代码可维护性指数，结果表明 MoTCoder 生成的代码更易于理解与修改，对长期代码维护与演化具有重要价值。相关代码已开源，地址为：https://github.com/dvlab-research/MoTCoder。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

MoTCoder：通过思维模块化提升大型语言模型在复杂编程任务中的表现 | 论文 | HyperAI超神经