智谱AI开源新一代GLM模型并推出国际平台Z.ai

7 小时前·来源:Synced
智谱AIGLM模型开源AI推理优化AI平台

智谱AI宣布全面开源其新一代通用语言模型GLM-4系列和GLM-Z1推理模型。GLM-Z1推理速度比DeepSeek-R1快8倍,达到每秒200个令牌。公司还推出了面向国际的平台Z.ai,提供免费访问和API服务。

2025年4月15日,中国AI公司智谱AI宣布全面开源其新一代通用语言模型GLM。此次发布包括先进的GLM-4系列和突破性的GLM-Z1推理模型,并推出了专用国际域名Z.ai。GLM-Z1推理模型声称推理速度比DeepSeek-R1快8倍,通过优化GQA参数、采用量化和实施推测采样,GLM-Z1-32B-0414在消费级GPU上实现每秒200个令牌的推理速度,比人类阅读速度快50倍。智谱AI还发布了“Rumination”模型GLM-Z1-Rumination-32B-0414,该模型能主动搜索互联网、使用工具、进行深度分析和自我验证信息,以处理复杂的开放式查询。开源组合还包括基础模型GLM-4-32B-0414,专门增强了代理能力,在工具使用、网络搜索和代码生成方面表现优异。智谱AI还开源了GLM-4和GLM-Z1的9B参数版本,这些模型在数学推理和一般任务中表现出色,适用于资源受限环境。所有模型均采用MIT许可发布。Z.ai平台作为全球用户的中心枢纽,提供通过网页界面和专用应用免费体验这些高级模型。对于企业客户,智谱AI继续提供其稳健的模型即服务平台,现已集成新开源的基础和推理模型,提供API访问和分层定价。

背景阅读

智谱AI是中国领先的人工智能公司,专注于开发大型语言模型和AI技术。其GLM系列模型在自然语言处理领域具有重要影响力,此前已发布多个版本,广泛应用于对话系统、代码生成和推理任务。开源AI模型是当前行业趋势,旨在促进技术民主化和社区创新,类似OpenAI的GPT系列和Meta的Llama模型的开源举措。推理速度优化是AI模型部署的关键挑战,涉及量化、采样等技术,以提高效率并降低计算成本。国际平台Z.ai的推出反映了中国AI公司全球扩张的战略,旨在吸引更广泛的用户群和开发者生态系统。

评论 (0)

登录后参与评论

加载评论中...