WRITER 团队于 2025 年 9 月 11 日发布了 Palmyra-mini 系列的三款开源模型。这些模型参数量在 1.5B 到 1.7B 之间,设计为轻量高效,适用于多种应用场景。系列包括基础模型 palmyra-mini,以及两个专为推理优化的变体 palmyra-mini-thinking-a 和 palmyra-mini-thinking-b。
推理模型采用了思维链训练方法,以提升逻辑和数学推理能力。palmyra-mini-thinking-a 在 GSM8K 基准测试中达到 82.87% 的准确率,而 palmyra-mini-thinking-b 在 AMC23 上获得 92.5% 的分数。基础模型 palmyra-mini 在 Big Bench Hard 上得分为 52.6%。
模型已在 Hugging Face 上提供下载,并支持 GGUF 和 MLX 量化格式,便于部署。所有模型基于 Qwen 架构,可在 vLLM、SGLang 等流行推理框架上运行。palmyra-thinking-b 的基础模型为 NVIDIA 的 OpenReasoning-Nemotron-1.5B,经过强化学习微调,但可能影响采样多样性。