NeoBeta - AI 科技资讯

Hugging Face今天分享了关于AI代理设计的研究，该研究结合了基于代码的动作表达能力和结构化生成的可靠性。研究发现，强制CodeAgents以结构化JSON格式生成思考和代码，可以在多个基准测试中显著优于传统方法。

AI代理需要执行动作，如调用API、处理数据或解决复杂问题。代理表达这些动作的方式经历了几个范式的演变。传统JSON代理通过生成结构化JSON来调用预定义工具，这种方法可靠但受限于有限的动作集、缺乏可组合性和僵化的结构。代码代理则利用其内在编码能力直接编写可执行的Python代码，提供更大的灵活性和智能工具使用能力，但解析代码时容易出错。

为了解决代码解析错误的问题，研究提出了将结构化输出应用于代码代理的方法。通过结构化输出，可以强制大型语言模型生成明确的思考和代码作为JSON块，其中代码部分被解析为可执行的Python。这种方法结合了代码代理的灵活性和结构化生成的可靠性，减少了错误，提高了代理的执行效率。研究在SmolBench等基准测试中验证了该方法的有效性，展示了其在处理复杂任务时的优势。

背景阅读

AI代理是能够自主执行任务的人工智能系统，通常通过调用工具或编写代码来与环境交互。近年来，代理设计经历了从简单工具调用到更复杂代码执行的演变。传统方法如JSON代理依赖于预定义工具，虽然可靠但灵活性有限。代码代理的出现，如CodeAct，允许代理编写任意Python代码，提高了灵活性和状态管理能力，但面临代码解析错误的挑战。结构化生成技术通过强制模型输出特定格式（如JSON）来增强可靠性和一致性，已在多个AI应用中得到应用。Hugging Face的这项研究旨在结合这两种范式的优势，通过结构化输出优化代码代理的执行过程，以应对更复杂的任务需求。

CodeAgents + 结构化输出：提升AI代理执行效率的新方法

背景阅读

相关阅读

Ettin Suite：首个SoTA配对编码器与解码器模型套件发布

Hugging Face 与 NVIDIA 合作推出训练集群即服务

Hugging Face 发布 ScreenSuite：最全面的 GUI 智能体评估套件

评论 (0)