日本初创公司 Sakana AI 的编码代理 ALE-Agent 在 AtCoder Heuristic Contest 竞赛中获得第一名。该竞赛涉及复杂的优化问题,比 HumanEval 等基准更具挑战性。ALE-Agent 在四小时内使用推理时缩放生成、测试和迭代数百个解决方案,解决了通常需要人类专家深度直觉和耗时试错的问题。它击败了超过 800 名人类参与者,包括顶级竞争程序员。
ALE-Agent 的创新在于将静态初始化工具转变为动态重建引擎。代理独立推导出“虚拟功率”概念,为尚未运行的组件分配价值,并利用“复利效应”进行前瞻性推理。代理通过反思每次试验生成文本“见解”,防止循环回到先前失败的策略,并创建工作记忆以提前几步规划。此外,代理将贪婪方法直接集成到模拟退火中,允许在探索和利用之间动态切换。
Sakana AI 团队表示,ALE-Agent 展示了 AI 代理在企业环境中自主导航和优化的潜力。企业软件栈和操作环境通常涉及复杂、动态的系统,需要代理能够适应和优化。ALE-Agent 的成功可能推动更多企业采用类似代理来处理优化任务。