NeoBetaNeoBeta
最新热门时间轴关系图

h800

硬件2 篇资讯
2026年1月20日

DeepSeek-V3新论文发布:揭秘硬件感知协同设计实现低成本大模型训练

DeepSeek团队发布14页技术论文,探讨大语言模型与硬件架构的协同设计。论文以DeepSeek-V3为例,展示如何通过硬件感知设计克服内存和计算瓶颈。研究聚焦硬件特性对模型架构的影响,为低成本大规模训练提供实践指导。

20:36
2026年1月13日

中国研究人员诊断AI图像模型失语症,开发自愈框架

中国研究人员发现多模态AI模型存在理解与生成能力不匹配现象,将其称为传导性失语症。他们开发了UniCorn框架,让单一模型同时扮演提议者、求解者和评判者三个角色。该框架在复杂场景生成和空间理解任务上表现显著提升,甚至在某些基准测试中超越GPT-4o。

18:25
NeoBetaNeoBeta

犀利、专业的 AI 科技资讯聚合器