Marktechpost发布了AI2025Dev分析平台,面向AI开发者和研究人员开放,无需注册或登录即可访问。该平台旨在将2025年的AI活动转化为可查询数据集,涵盖模型发布、开放程度、训练规模、基准测试性能和生态系统参与者等多个维度。Marktechpost是一家总部位于加利福尼亚的AI新闻平台,专注于机器学习、深度学习和数据科学研究。
AI2025Dev的2025版本扩展了覆盖范围,包括两个主要数据层。发布分析层专注于模型和框架发布、许可证状态、供应商活动和功能级别细分。生态系统指数层包括精心策划的“Top 100”集合,将模型与相关论文、研究人员和资本联系起来。这些指数设计为可导航和可筛选,而非静态编辑列表,使团队能够追踪公司、模型类型、基准分数和发布时间等要素之间的关系。
AI2025Dev的“2025年AI发布”概览基于结构化市场地图数据集,涵盖100个跟踪发布和39家活跃公司。数据集将每个条目标准化为一致的模式,包括名称、公司、类型、许可证、旗舰状态和发布日期。关键聚合指标包括总发布数100个,开放份额69%,旗舰模型63个,活跃公司39家。市场地图中的模型类别覆盖明确分类,包括LLM(58个)、Agentic Model(11个)、Vision Model(8个)、Tool(7个)、Multimodal(6个)、Framework(4个)、Code Model(2个)、Audio Model(2个),以及Embedding Model(1个)和Agent(1个)。
平台还包含“2025年关键发现”数据层,将年度变化呈现为数据集的可测量切片。平台突出了三个反复出现的技术主题:开放权重采用,追踪开源或开放权重条款下权重可用发布的增长份额;代理和工具使用系统,追踪围绕工具使用、编排和任务执行的模型和系统增长;效率和压缩,反映2025年蒸馏和其他模型优化技术日益针对更小规模同时保持竞争力的基准行为。
专用可视化工具追踪2025年LLM训练数据规模,涵盖1.4万亿到36万亿令牌,并将令牌预算与发布时间线对齐。通过在同一视图中编码令牌规模和日期,平台使比较供应商如何随时间分配训练预算以及极端规模如何与观察到的基准结果相关成为可能。