谷歌发布Gemini 2.5计算机使用模型预览版

2 天前·来源:DeepMind Blog
谷歌GeminiAI模型智能体API

谷歌推出了基于Gemini 2.5 Pro的计算机使用模型预览版。该模型专为与用户界面交互的智能体设计。目前可通过API访问这一新模型。

谷歌发布了Gemini 2.5计算机使用模型,这是一个基于Gemini 2.5 Pro能力的专门模型。该模型旨在驱动能够与用户界面交互的智能体。目前,该模型已通过API提供预览版访问。

背景阅读

Gemini是谷歌开发的大型语言模型系列,旨在处理多模态任务,包括文本、图像和代码。Gemini 2.5 Pro是Gemini系列的最新版本之一,提供了增强的性能和更广泛的应用能力。计算机使用模型是Gemini 2.5 Pro的一个专门化分支,专注于自动化用户界面交互,这属于AI代理和自动化领域。AI代理能够执行复杂任务,如网页浏览、软件操作和数据提取,通常依赖于计算机视觉和自然语言处理技术。谷歌通过API提供预览版,允许开发者和企业测试和集成这一技术,以推动智能助手、自动化工具和机器人流程自动化的发展。这一发布反映了AI模型在具体应用场景中的专业化趋势,以及谷歌在AI基础设施和工具生态系统的持续投入。

评论 (0)

登录后参与评论

加载评论中...