DeepMind 发布了 Gemma Scope 2,这是一个用于 Gemma 3 模型的开源可解释性工具套件。该套件支持从 270M 到 27B 参数的所有 Gemma 3 模型尺寸。Gemma Scope 2 结合稀疏自编码器和转码器,允许研究人员查看模型内部,理解其思维过程和行为形成。开发 Gemma Scope 2 涉及存储约 110 PB 数据,并训练超过 1 万亿参数。DeepMind 表示,这是 AI 实验室迄今为止最大的开源可解释性工具发布。Gemma Scope 2 旨在帮助 AI 安全社区调试新兴模型行为,审计和调试 AI 代理,并加速针对越狱、幻觉和谄媚等问题的安全干预措施开发。一个交互式演示已通过 Neuronpedia 提供。