AI 智能体正迅速成为构建智能应用的关键,但创建健壮、可适应且能跨领域扩展的智能体仍具挑战。许多现有框架在处理复杂工作流时面临脆弱性、工具误用和失败问题。CUGA(可配置通用智能体)旨在克服这些限制,它是一个开源 AI 智能体,结合了灵活性、可靠性和易用性,适用于企业用例。通过抽象编排复杂性,CUGA 使开发者能专注于领域需求而非智能体构建内部细节。现在,随着其集成至 Hugging Face Spaces,实验 CUGA 和开源模型变得更加容易。
CUGA 是一个可配置的通用 AI 智能体,支持跨网络和 API 环境的复杂多步骤任务。它在领先基准测试中取得了最先进性能:在 AppWorld 上排名第一,该基准包含 457 个 API 的 750 个真实世界任务;在 WebArena 上位居顶级,展示了 CUGA 的计算机使用能力,这是一个跨应用领域的自主网络智能体复杂基准。CUGA 的核心特性包括高性能通用智能体,在复杂网络和 API 任务上进行基准测试,结合了最佳智能体模式(如规划器-执行器、代码行动)与结构化规划和智能变量管理,以防止幻觉并处理复杂性;可配置推理模式,通过从快速启发式到深度规划的灵活模式平衡性能和成本/延迟,优化任务需求;计算机使用,轻松在工作流中结合 UI 交互和 API 调用;多工具集成,通过 OpenAPI 规范、MCP 服务器和 LangChain 无缝集成工具,实现与 REST API、自定义协议和 Python 函数的快速连接;与 Langflow 集成,提供低代码可视化构建体验,用于设计和部署智能体工作流,无需大量编码;可组合性,CUGA 可作为工具暴露给其他智能体,实现嵌套推理和多智能体协作。
CUGA 架构从用户消息流入聊天层开始,该层基于上下文解释意图并构建用户目标。任务规划和控制组件然后将此目标分解为结构化子任务,通过动态任务分类账以编程方式跟踪。该分类账支持在需要时重新规划,确保健壮执行。子任务被委托给专门智能体,如 API 智能体,它在安全沙箱中调用代码前使用内部推理循环生成伪代码指令。系统利用工具注册表,超越 MCP 协议来解析和理解工具能力,实现精确编排。一旦所有步骤完成,最终响应返回给用户,提供可靠、策略对齐的结果。