6 个月前

自然语言处理

Han Li Yuling Shi Shaoxin Lin Xiaodong Gu Heng Lian Xin Wang Yantao Jia Tao Huang Qianxiang Wang

摘要

问题修复已因大型语言模型（LLMs）先进的推理能力而取得显著进展。近期，基于智能体的框架（如 SWE-agent）通过引入能够自主使用工具的智能体，进一步推动了这一进展，使其能够应对复杂的软件工程任务。然而，现有的基于智能体的问题修复方法主要依赖于智能体的独立探索，往往陷入局部解，难以识别跨越代码库多个部分的缺陷模式。为解决这一局限性，我们提出 SWE-Debate——一种竞争性多智能体辩论框架，旨在激发多样化的推理路径，实现更精准的问题定位。SWE-Debate 首先通过遍历代码依赖图，生成多个故障传播路径作为定位候选方案；随后，组织三个回合的辩论，由具备不同推理视角的专用智能体围绕故障传播路径展开讨论。这种结构化的竞争机制促使智能体协同收敛至一个统一的修复方案。最终，该统一的修复方案被整合进基于 MCTS（蒙特卡洛树搜索）的代码修改智能体，用于生成补丁。在 SWE-bench 基准上的实验表明，SWE-Debate 在开源智能体框架中达到了新的最先进水平，显著优于现有基线方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

Han Li Yuling Shi Shaoxin Lin Xiaodong Gu Heng Lian Xin Wang Yantao Jia Tao Huang Qianxiang Wang

摘要

问题修复已因大型语言模型（LLMs）先进的推理能力而取得显著进展。近期，基于智能体的框架（如 SWE-agent）通过引入能够自主使用工具的智能体，进一步推动了这一进展，使其能够应对复杂的软件工程任务。然而，现有的基于智能体的问题修复方法主要依赖于智能体的独立探索，往往陷入局部解，难以识别跨越代码库多个部分的缺陷模式。为解决这一局限性，我们提出 SWE-Debate——一种竞争性多智能体辩论框架，旨在激发多样化的推理路径，实现更精准的问题定位。SWE-Debate 首先通过遍历代码依赖图，生成多个故障传播路径作为定位候选方案；随后，组织三个回合的辩论，由具备不同推理视角的专用智能体围绕故障传播路径展开讨论。这种结构化的竞争机制促使智能体协同收敛至一个统一的修复方案。最终，该统一的修复方案被整合进基于 MCTS（蒙特卡洛树搜索）的代码修改智能体，用于生成补丁。在 SWE-bench 基准上的实验表明，SWE-Debate 在开源智能体框架中达到了新的最先进水平，显著优于现有基线方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供