Nous Research 发布开源编程模型 NousCoder-14B,对标 Claude Code

2026/1/13·来源:VentureBeat
Nous ResearchNousCoder-14BAI编程模型开源AIClaude Code

开源 AI 初创公司 Nous Research 发布了 NousCoder-14B 编程模型。该模型在 LiveCodeBench v6 基准测试中准确率达 67.87%,基于阿里 Qwen3-14B 训练。Nous Research 公开了模型权重和完整训练环境,强调开源透明度。

开源人工智能初创公司 Nous Research 发布了 NousCoder-14B 编程模型。该模型在 LiveCodeBench v6 基准测试中准确率达到 67.87%,相比其基础模型阿里 Qwen3-14B 提升了 7.08 个百分点。Nous Research 公开了模型权重、完整的强化学习环境、基准测试套件和训练框架,基于其 Atropos 框架构建,使研究人员能够复现训练过程。该模型使用 48 个英伟达 B200 图形处理器,在四天内完成训练。NousCoder-14B 的发布正值 Anthropic 的 Claude Code 编程工具在社交媒体上引发广泛讨论之际,谷歌工程师 Jaana Dogan 分享了一个示例,Claude Code 根据简短提示近似重现了她团队花费一年开发的系统。Nous Research 强调开源替代方案在可验证问题上的训练能力,以及模型构建透明度的重要性。

背景阅读

Nous Research 是一家专注于开源人工智能的初创公司,由加密货币风险投资公司 Paradigm 支持。近年来,AI 编程助手领域竞争激烈,包括 OpenAI 的 Codex、GitHub Copilot、Anthropic 的 Claude Code 等。这些模型旨在辅助软件开发,提高编程效率和代码质量。开源模型如 Meta 的 Code Llama 和阿里云的 Qwen 系列也在该领域占据一席之地。LiveCodeBench 是一个标准化评估基准,用于测试模型在竞争性编程问题上的表现,覆盖 2024 年 8 月至 2025 年 5 月的问题。NousCoder-14B 基于 Qwen3-14B 训练,后者是阿里云开发的开源语言模型。Atropos 是 Nous Research 开发的框架,用于高效训练和评估 AI 模型。开源 AI 模型强调透明度和可复现性,与闭源模型形成对比,有助于推动技术民主化和社区协作。

评论 (0)

登录后参与评论

加载评论中...