NeoBeta - AI 科技资讯

OpenAI发布了全新的开源模型系列GPT OSS，这是该公司备受期待的开源权重发布。GPT OSS包含两个模型：一个大型模型拥有1170亿参数，一个小型模型拥有210亿参数。两个模型都采用专家混合架构，并使用4位量化方案，能够在保持低资源使用的同时实现快速推理。大型模型可适配单个H100 GPU，小型模型可在16GB内存中运行，适合消费级硬件和端侧应用。

模型采用Apache 2.0许可证，并附有最低使用政策。OpenAI表示，这一发布是他们致力于开源生态系统的重要一步，符合其让AI惠及更广泛人群的使命。模型支持推理、指令遵循和工具使用，可通过Hugging Face的推理提供商服务访问。

在架构方面，GPT OSS采用带SwiGLU激活的令牌选择专家混合架构。每个注意力层使用128K上下文的RoPE，交替使用全上下文和128令牌滑动窗口注意力层。模型使用与GPT-4o相同的分词器，并加入了一些新令牌以实现与响应API的兼容性。

背景阅读

GPT OSS是OpenAI首次推出的开源模型系列，标志着该公司在开源策略上的重要转变。此前，OpenAI的GPT系列模型主要通过API服务提供，而开源社区主要由Meta的Llama系列、Google的Gemma系列等主导。专家混合架构通过激活部分参数而非全部参数来提高推理效率，已在多个大型语言模型中应用。4位量化是一种模型压缩技术，通过降低权重精度来减少内存占用和计算需求，使大模型能够在资源受限的环境中部署。Apache 2.0许可证是开源软件中常用的宽松许可证，允许商业使用、修改和分发。Hugging Face作为开源AI模型的重要平台，为开发者提供了模型托管、推理服务和部署工具。OpenAI的这一发布有望降低AI模型的使用门槛，促进更多创新应用的发展。

OpenAI发布GPT OSS开源模型系列，包含117B和21B两个版本

背景阅读

相关阅读

谷歌云C4虚拟机与英特尔、Hugging Face合作，GPT OSS总拥有成本降低70%

Palmyra-mini 系列模型发布：轻量高效，专为推理设计

Together AI 支持微调 Hugging Face Hub 上的任何大语言模型

评论 (0)