谷歌发布了Gemini 2.5计算机使用模型,这是一个基于Gemini 2.5 Pro能力的专门模型。该模型旨在驱动能够与用户界面交互的智能体。目前,该模型已通过API提供预览版访问。
谷歌推出了基于Gemini 2.5 Pro的计算机使用模型预览版。该模型专为与用户界面交互的智能体设计。目前可通过API访问这一新模型。
谷歌发布了Gemini 2.5计算机使用模型,这是一个基于Gemini 2.5 Pro能力的专门模型。该模型旨在驱动能够与用户界面交互的智能体。目前,该模型已通过API提供预览版访问。
Gemini是谷歌开发的大型语言模型系列,旨在处理多模态任务,包括文本、图像和代码。Gemini 2.5 Pro是Gemini系列的最新版本之一,提供了增强的性能和更广泛的应用能力。计算机使用模型是Gemini 2.5 Pro的一个专门化分支,专注于自动化用户界面交互,这属于AI代理和自动化领域。AI代理能够执行复杂任务,如网页浏览、软件操作和数据提取,通常依赖于计算机视觉和自然语言处理技术。谷歌通过API提供预览版,允许开发者和企业测试和集成这一技术,以推动智能助手、自动化工具和机器人流程自动化的发展。这一发布反映了AI模型在具体应用场景中的专业化趋势,以及谷歌在AI基础设施和工具生态系统的持续投入。
Google 为 Gemini 应用的 Ultra 订阅用户推出 Deep Think 功能。部分数学家已获得 Gemini 2.5 Deep Think 模型的完整版本访问权限。该模型将参与国际数学奥林匹克竞赛。
Gemini 应用更新了原生图像编辑功能。用户现在能以新方式转换图像。这一升级提升了图像处理能力。
Gemini 2.5 Flash-Lite 模型已结束预览阶段,正式稳定发布并面向一般用户开放。该模型以较小尺寸提供高质量性能,并具备 100 万令牌上下文窗口和多模态等 Gemini 2.5 系列特性。作为一款成本效益高的模型,它适用于需要高效 AI 处理的生产环境。
登录后参与评论