OpenAI发布GPT OSS开源模型系列,包含117B和21B两个版本

1 天前·来源:Hugging Face Blog
OpenAIGPT OSS开源模型专家混合架构模型量化

OpenAI发布了全新的开源模型系列GPT OSS,包含117B和21B两个参数规模的模型。这两个模型采用专家混合架构和4位量化方案,支持推理和工具使用。模型采用Apache 2.0许可证,旨在促进AI技术的广泛可及性。

OpenAI发布了全新的开源模型系列GPT OSS,这是该公司备受期待的开源权重发布。GPT OSS包含两个模型:一个大型模型拥有1170亿参数,一个小型模型拥有210亿参数。两个模型都采用专家混合架构,并使用4位量化方案,能够在保持低资源使用的同时实现快速推理。大型模型可适配单个H100 GPU,小型模型可在16GB内存中运行,适合消费级硬件和端侧应用。

模型采用Apache 2.0许可证,并附有最低使用政策。OpenAI表示,这一发布是他们致力于开源生态系统的重要一步,符合其让AI惠及更广泛人群的使命。模型支持推理、指令遵循和工具使用,可通过Hugging Face的推理提供商服务访问。

在架构方面,GPT OSS采用带SwiGLU激活的令牌选择专家混合架构。每个注意力层使用128K上下文的RoPE,交替使用全上下文和128令牌滑动窗口注意力层。模型使用与GPT-4o相同的分词器,并加入了一些新令牌以实现与响应API的兼容性。

背景阅读

GPT OSS是OpenAI首次推出的开源模型系列,标志着该公司在开源策略上的重要转变。此前,OpenAI的GPT系列模型主要通过API服务提供,而开源社区主要由Meta的Llama系列、Google的Gemma系列等主导。专家混合架构通过激活部分参数而非全部参数来提高推理效率,已在多个大型语言模型中应用。4位量化是一种模型压缩技术,通过降低权重精度来减少内存占用和计算需求,使大模型能够在资源受限的环境中部署。Apache 2.0许可证是开源软件中常用的宽松许可证,允许商业使用、修改和分发。Hugging Face作为开源AI模型的重要平台,为开发者提供了模型托管、推理服务和部署工具。OpenAI的这一发布有望降低AI模型的使用门槛,促进更多创新应用的发展。

评论 (0)

登录后参与评论

加载评论中...