Hugging Face今天分享了关于AI代理设计的研究,该研究结合了基于代码的动作表达能力和结构化生成的可靠性。研究发现,强制CodeAgents以结构化JSON格式生成思考和代码,可以在多个基准测试中显著优于传统方法。
AI代理需要执行动作,如调用API、处理数据或解决复杂问题。代理表达这些动作的方式经历了几个范式的演变。传统JSON代理通过生成结构化JSON来调用预定义工具,这种方法可靠但受限于有限的动作集、缺乏可组合性和僵化的结构。代码代理则利用其内在编码能力直接编写可执行的Python代码,提供更大的灵活性和智能工具使用能力,但解析代码时容易出错。
为了解决代码解析错误的问题,研究提出了将结构化输出应用于代码代理的方法。通过结构化输出,可以强制大型语言模型生成明确的思考和代码作为JSON块,其中代码部分被解析为可执行的Python。这种方法结合了代码代理的灵活性和结构化生成的可靠性,减少了错误,提高了代理的执行效率。研究在SmolBench等基准测试中验证了该方法的有效性,展示了其在处理复杂任务时的优势。