HyperAIHyperAI

Command Palette

Search for a command to run...

SWE-Debate:用于软件问题解决的竞争性多Agent辩论

Han Li Yuling Shi Shaoxin Lin Xiaodong Gu Heng Lian Xin Wang Yantao Jia Tao Huang Qianxiang Wang

Abstract

问题修复已因大型语言模型(LLMs)先进的推理能力而取得显著进展。近期,基于智能体的框架(如 SWE-agent)通过引入能够自主使用工具的智能体,进一步推动了这一进展,使其能够应对复杂的软件工程任务。然而,现有的基于智能体的问题修复方法主要依赖于智能体的独立探索,往往陷入局部解,难以识别跨越代码库多个部分的缺陷模式。为解决这一局限性,我们提出 SWE-Debate——一种竞争性多智能体辩论框架,旨在激发多样化的推理路径,实现更精准的问题定位。SWE-Debate 首先通过遍历代码依赖图,生成多个故障传播路径作为定位候选方案;随后,组织三个回合的辩论,由具备不同推理视角的专用智能体围绕故障传播路径展开讨论。这种结构化的竞争机制促使智能体协同收敛至一个统一的修复方案。最终,该统一的修复方案被整合进基于 MCTS(蒙特卡洛树搜索)的代码修改智能体,用于生成补丁。在 SWE-bench 基准上的实验表明,SWE-Debate 在开源智能体框架中达到了新的最先进水平,显著优于现有基线方法。


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SWE-Debate:用于软件问题解决的竞争性多Agent辩论 | Papers | HyperAI超神经