开源人工智能初创公司 Nous Research 发布了 NousCoder-14B 编程模型。该模型在 LiveCodeBench v6 基准测试中准确率达到 67.87%,相比其基础模型阿里 Qwen3-14B 提升了 7.08 个百分点。Nous Research 公开了模型权重、完整的强化学习环境、基准测试套件和训练框架,基于其 Atropos 框架构建,使研究人员能够复现训练过程。该模型使用 48 个英伟达 B200 图形处理器,在四天内完成训练。NousCoder-14B 的发布正值 Anthropic 的 Claude Code 编程工具在社交媒体上引发广泛讨论之际,谷歌工程师 Jaana Dogan 分享了一个示例,Claude Code 根据简短提示近似重现了她团队花费一年开发的系统。Nous Research 强调开源替代方案在可验证问题上的训练能力,以及模型构建透明度的重要性。