Google Cloud Next 2025 大会宣布多项 AI 更新。Ironwood TPU 提供五倍计算能力和六倍内存容量。Vertex AI 新增 Lyria 模型,支持视频、图像、语音和音乐生成。Gemini 2.5 Flash 模型即将在 Vertex AI 上线。
DeepMind 推出了 AlphaGenome AI 工具,用于预测人类 DNA 序列中单变异对基因调控过程的影响。该模型能处理长达 100 万碱基对的 DNA 序列,并输出高分辨率预测。AlphaGenome 已通过 API 提供预览,供非商业研究使用。
普林斯顿Zlab研究人员发布了LLM-Pruning Collection,这是一个基于JAX的开源库,整合了多种大语言模型剪枝算法。该库提供了统一的训练和评估框架,支持GPU和TPU,便于比较不同剪枝方法。它包含Minitron、ShortGPT、Wanda、SparseGPT、Magnitude、Sheared Llama和LLM-Pruner等算法实现。
谷歌发布了开源翻译模型TranslateGemma系列,支持55种语言。该模型提供三种参数规模,适用于移动设备、笔记本电脑和云服务器。其12B版本在翻译质量上超越了更大规模的模型,尤其在低资源语言上表现突出。
Google 的 Gemini 模型在 AI 领域展现出强劲竞争力。Gemini 3 被广泛认为是市场上最佳的大型语言模型之一。Google 与 Apple 合作,Gemini 将驱动新一代 Siri,扩大其用户覆盖范围。
智能仓库正从云端转向边缘AI,以解决物流中的延迟瓶颈。自主移动机器人依赖本地处理实现毫秒级决策,避免碰撞。这一转变改变了仓库的带宽经济,支持大规模机器人部署。