IBM 发布了 Granite 4.0 Nano 系列模型,这是其 Granite 4.0 模型家族的一部分,也是目前最小的模型。这些模型专为边缘和设备端应用设计,展示了在小型参数规模下的出色性能。Granite 4.0 Nano 模型在 Apache 2.0 许可下发布,支持 vLLM、llama.cpp 和 MLX 等流行运行时。模型使用了与原始 Granite 4.0 模型相同的改进训练方法、流水线和超过 15T 标记的训练数据。该系列包括受益于 Granite 4.0 高效混合架构的变体,并持有 IBM 的 ISO 42001 认证,以确保负责任模型开发。具体来说,Granite 4.0 Nano 包括 4 个指令模型及其基础模型对应版本:Granite 4.0 H 1B 是一个约 1.5B 参数的密集 LLM,采用基于混合-SSM 的架构;Granite 4.0 H 350M 是一个约 350M 参数的密集 LLM,同样采用混合架构;Granite 4.0 1B 和 Granite 4.0 350M 是传统变压器版本的替代模型,适用于混合架构尚未优化支持的工作负载。在通用知识、数学、代码和安全领域的基准测试中,Granite 4.0 Nano 模型相比其他类似规模模型显示出显著能力提升。此外,在指令遵循和工具调用等代理工作流关键任务上,Granite Nano 模型也优于多个类似规模模型,基于 IFEval 和 BFCLv3 基准测试。完整详情可在 Hugging Face 模型卡中找到。