谷歌发布Gemini 2.5计算机使用模型预览版

2 天前·来源：DeepMind Blog

谷歌GeminiAI模型智能体API

谷歌推出了基于Gemini 2.5 Pro的计算机使用模型预览版。该模型专为与用户界面交互的智能体设计。目前可通过API访问这一新模型。

谷歌发布了Gemini 2.5计算机使用模型，这是一个基于Gemini 2.5 Pro能力的专门模型。该模型旨在驱动能够与用户界面交互的智能体。目前，该模型已通过API提供预览版访问。

背景阅读

Gemini是谷歌开发的大型语言模型系列，旨在处理多模态任务，包括文本、图像和代码。Gemini 2.5 Pro是Gemini系列的最新版本之一，提供了增强的性能和更广泛的应用能力。计算机使用模型是Gemini 2.5 Pro的一个专门化分支，专注于自动化用户界面交互，这属于AI代理和自动化领域。AI代理能够执行复杂任务，如网页浏览、软件操作和数据提取，通常依赖于计算机视觉和自然语言处理技术。谷歌通过API提供预览版，允许开发者和企业测试和集成这一技术，以推动智能助手、自动化工具和机器人流程自动化的发展。这一发布反映了AI模型在具体应用场景中的专业化趋势，以及谷歌在AI基础设施和工具生态系统的持续投入。

谷歌发布Gemini 2.5计算机使用模型预览版

背景阅读

相关阅读

Google 在 Gemini 应用中推出 Deep Think 功能

Gemini 应用原生图像编辑功能迎来重大升级

Gemini 2.5 Flash-Lite 模型现已正式发布并可用于规模化生产

评论 (0)