Gemini 2.5 推出AI音频对话与生成新功能

1 天前·来源：DeepMind Blog

GeminiAI音频谷歌AI

Gemini 2.5 新增了AI驱动的音频对话和生成能力。该功能基于谷歌的AI模型技术实现。这标志着Gemini系列在音频处理领域的扩展。

Gemini 2.5 引入了AI驱动的音频对话和生成新功能。这些能力利用谷歌的先进AI模型技术，专注于音频内容的处理和创造。

背景阅读

Gemini是谷歌开发的一系列AI模型，旨在处理多模态任务，包括文本、图像和音频。Gemini 2.5是其最新版本，专注于提升音频相关功能。音频对话和生成是AI领域的重要分支，涉及语音识别、自然语言处理和音频合成技术。近年来，随着深度学习的发展，AI在音频处理方面取得了显著进展，如语音助手、音乐生成和实时翻译等应用。谷歌通过Gemini系列不断扩展AI能力，以应对日益增长的多模态需求。音频功能的增强有助于推动AI在娱乐、教育和通信等行业的应用。

Gemini 2.5 推出AI音频对话与生成新功能

背景阅读

相关阅读

Google推出Gemini Robotics On-Device，将AI模型本地部署至机器人设备

谷歌扩展Gemini 2.5模型家族，推出Flash-Lite版本

谷歌DeepMind推出Weather Lab，用AI提升热带气旋预测精度

评论 (0)