NeoBeta - AI 科技资讯

日本初创公司 Sakana AI 的编码代理 ALE-Agent 在 AtCoder Heuristic Contest 竞赛中获得第一名。该竞赛涉及复杂的优化问题，比 HumanEval 等基准更具挑战性。ALE-Agent 在四小时内使用推理时缩放生成、测试和迭代数百个解决方案，解决了通常需要人类专家深度直觉和耗时试错的问题。它击败了超过 800 名人类参与者，包括顶级竞争程序员。

ALE-Agent 的创新在于将静态初始化工具转变为动态重建引擎。代理独立推导出“虚拟功率”概念，为尚未运行的组件分配价值，并利用“复利效应”进行前瞻性推理。代理通过反思每次试验生成文本“见解”，防止循环回到先前失败的策略，并创建工作记忆以提前几步规划。此外，代理将贪婪方法直接集成到模拟退火中，允许在探索和利用之间动态切换。

Sakana AI 团队表示，ALE-Agent 展示了 AI 代理在企业环境中自主导航和优化的潜力。企业软件栈和操作环境通常涉及复杂、动态的系统，需要代理能够适应和优化。ALE-Agent 的成功可能推动更多企业采用类似代理来处理优化任务。

背景阅读

AtCoder Heuristic Contest 是一个专注于启发式算法的编程竞赛，参与者需要解决组合优化问题，这些问题通常涉及在约束条件下最大化或最小化目标函数。组合优化在物流、调度和资源分配等领域有广泛应用。传统上，人类专家使用贪婪方法和模拟退火等策略解决这些问题，但这些方法可能因初始方案不佳而受限。AI 代理，特别是编码代理，正逐渐应用于自动化编程和优化任务，例如 GitHub Copilot 和 ChatGPT 的代码生成功能。然而，大多数现有代理主要针对函数级代码生成，而 ALE-Agent 在复杂系统级优化中表现出色，这反映了 AI 代理从简单代码辅助向自主系统导航的演进。Sakana AI 是一家专注于 AI 研究的日本初创公司，致力于开发高效和创新的 AI 模型。

Sakana AI 编码代理在 AtCoder 竞赛夺冠，预示企业代理新方向

背景阅读

相关阅读

AI模型缺乏统一“自我”，Anthropic研究员称非缺陷

DeepSeek提出条件记忆机制，解决LLM静态查询的GPU资源浪费问题

Anthropic 推出 Claude Cowork 通用智能体，10天开发完成

评论 (0)