谷歌宣布其Gemini 2.5模型家族已扩展,Gemini 2.5 Flash和Pro模型现已全面可用。此外,公司推出了Gemini 2.5 Flash-Lite,这是该系列中最具成本效益和最快的2.5模型。这些模型旨在为开发者提供更多AI工具选项,以支持各种应用场景。
谷歌宣布Gemini 2.5 Flash和Pro模型现已全面可用。同时,公司推出了Gemini 2.5 Flash-Lite,这是其最具成本效益和最快的2.5模型。这一扩展旨在为开发者提供更多AI模型选择,以优化性能和成本。
谷歌宣布其Gemini 2.5模型家族已扩展,Gemini 2.5 Flash和Pro模型现已全面可用。此外,公司推出了Gemini 2.5 Flash-Lite,这是该系列中最具成本效益和最快的2.5模型。这些模型旨在为开发者提供更多AI工具选项,以支持各种应用场景。
Gemini是谷歌开发的多模态AI模型系列,旨在处理文本、图像、音频和视频等多种输入类型。Gemini 2.5是这一系列的最新版本,此前已推出多个变体,如Gemini 2.0和早期版本。Gemini模型在AI领域具有重要地位,与OpenAI的GPT系列、Anthropic的Claude等竞争,广泛应用于聊天机器人、内容生成和数据分析等任务。谷歌通过不断更新模型,如推出Flash和Pro版本,以提升性能和效率,满足不同用户需求。此次扩展反映了AI模型向轻量化和成本优化方向发展的趋势,有助于降低AI应用的门槛。
Google 的 Gemma 3n 模型现已全面开源,可在主流开源库中使用。该模型原生支持图像、文本、音频和视频输入,专为本地硬件运行设计。发布两个版本,E2B 和 E4B,分别需要 2GB 和 3GB GPU 内存,性能超越传统参数规模模型。
Google发布了Gemini Robotics On-Device,这是一款专为机器人设备优化的本地运行视觉语言动作模型。该模型具备强大的通用灵巧性和任务泛化能力,可在无网络连接环境下运行。同时,Google提供了Gemini Robotics SDK,帮助开发者快速评估和适配模型到新任务中。
NVIDIA 发布了 Llama Nemotron Nano VLM 模型,这是一个基于 Llama 架构的视觉语言模型。该模型已上传至 Hugging Face Hub,供开发者免费下载和使用。它支持图像理解和文本生成任务,适用于多模态 AI 应用。
登录后参与评论