无Agent方案成功逆袭:成本不到1/10,SWE-bench出新的竞争者!

在优化软件工程的技术战场上,近日,一种名为“Agentless”的新方式在SWE-bench基准测试中以绝对优势获胜,令人瞩目。这一方案凭借其惊人的成本效益和简单高效的操作流程,在众多传统的基于Agent的解决方案中脱颖而出,标志着一个新的趋势的崛起。

传统的AI Agent策略通常涉及复杂的系统设计与高级算法,但Agentless则反其道而行之,采用了出乎意料的简化方法。该方案的基本操作流程是对整个代码仓库进行全面扫描,构建出完整的代码树状结构,类似于对代码进行一次全身体检。

在生成的树状结构基础上,Agentless进一步结合问题描述,运用提示词和嵌入技术来定位可疑文件。这一过程就如同一位经验丰富的医生,通过症状快速锁定病灶。然而,Agentless并非草率行事,在精准定位潜在问题后,它会细致研究这些文件的“骨架结构”,即类和函数的组织,最终才确定需要修改的具体代码行。

与许多工具直接重写整个代码块不同,Agentless采取了一种更加谨慎和灵活的策略:生成多个搜索/替换式的补丁。这样的“微创手术”方式最大限度地降低了出错的风险,也使问题的解决变得更加高效。

测试是在技术解决方案中无比重要的一环,Agentless在保证代码修改的有效性上也进行了严密把关。其系统会自动创建测试用例,以验证每个修复是否成功,并在此基础上运行现有的回归测试,确保新修改不会引入其他问题。这种严格的测试机制,使得Agentless在使用Claude3.5Sonnet作为底层模型的情况下,在SWE-benchlite和verified测试集上分别达到了40.7%和50.8%的解决率,显著超过了现有的开源Agent方案。

值得注意的是,Agentless的费用也获得了极大的压缩。据统计,每解决一个问题的成本仅为0.7美元,较传统Agent方案动辄几美元甚至十几美元的花费低了一个数量级。这一矫正成本的关键在于Agentless的设计理念:通过采用搜索/替换而非整体重写代码,大幅减少了API调用次数,从而显著降低了整体费用。

Agentless的成功表明,复杂的解决方案并非唯一出路。如今的技术世界中,简约的设计不仅能提升效率,还能在经济上形成显著优势。OpenAI已经在其最新模型里应用了这一思路,将这种理念贯穿于GPT-4o、o1和o3中,这一举动不仅验证了Agentless的实力,同时也说明在AI领域,"少即是多"的理念逐渐被认同和采纳。

综上所述,Agentless的崛起并不仅仅是一次技术的胜利,它很可能成为未来软件开发的一个重要趋势。与复杂的传统Agent方案相比,这种简化策略为开发者提供了更高效、经济以及可扩展的解决方案,使得更广泛的开发者能够参与到日常的代码维护和问题解决中。随着这一技术的推广和应用,我们可以期待在未来的软件开发中,简约而高效的策略将会占据越来越重要的地位。是否会出现新的工具和平台以支持这一技能的普及呢?让我们拭目以待!

解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → → https://ai.sohu.com/pc/textHome?trans=030001_jdaidzkj

返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()