NeoBeta - AI 科技资讯

Marktechpost发布了AI2025Dev分析平台，面向AI开发者和研究人员开放，无需注册或登录即可访问。该平台旨在将2025年的AI活动转化为可查询数据集，涵盖模型发布、开放程度、训练规模、基准测试性能和生态系统参与者等多个维度。Marktechpost是一家总部位于加利福尼亚的AI新闻平台，专注于机器学习、深度学习和数据科学研究。

AI2025Dev的2025版本扩展了覆盖范围，包括两个主要数据层。发布分析层专注于模型和框架发布、许可证状态、供应商活动和功能级别细分。生态系统指数层包括精心策划的“Top 100”集合，将模型与相关论文、研究人员和资本联系起来。这些指数设计为可导航和可筛选，而非静态编辑列表，使团队能够追踪公司、模型类型、基准分数和发布时间等要素之间的关系。

AI2025Dev的“2025年AI发布”概览基于结构化市场地图数据集，涵盖100个跟踪发布和39家活跃公司。数据集将每个条目标准化为一致的模式，包括名称、公司、类型、许可证、旗舰状态和发布日期。关键聚合指标包括总发布数100个，开放份额69%，旗舰模型63个，活跃公司39家。市场地图中的模型类别覆盖明确分类，包括LLM（58个）、Agentic Model（11个）、Vision Model（8个）、Tool（7个）、Multimodal（6个）、Framework（4个）、Code Model（2个）、Audio Model（2个），以及Embedding Model（1个）和Agent（1个）。

平台还包含“2025年关键发现”数据层，将年度变化呈现为数据集的可测量切片。平台突出了三个反复出现的技术主题：开放权重采用，追踪开源或开放权重条款下权重可用发布的增长份额；代理和工具使用系统，追踪围绕工具使用、编排和任务执行的模型和系统增长；效率和压缩，反映2025年蒸馏和其他模型优化技术日益针对更小规模同时保持竞争力的基准行为。

专用可视化工具追踪2025年LLM训练数据规模，涵盖1.4万亿到36万亿令牌，并将令牌预算与发布时间线对齐。通过在同一视图中编码令牌规模和日期，平台使比较供应商如何随时间分配训练预算以及极端规模如何与观察到的基准结果相关成为可能。

背景阅读

随着人工智能技术的快速发展，AI模型发布、基准测试和生态系统参与者数量急剧增加，产生了大量分散的数据。传统上，研究人员和开发者需要从多个来源手动收集和分析这些信息，过程繁琐且难以进行系统性比较。结构化数据平台的出现旨在解决这一问题，通过标准化和整合不同维度的AI活动数据，提供可查询、可分析的数据集。这类平台通常涵盖模型类型、许可证状态、训练规模、基准性能等关键指标，帮助用户追踪技术趋势、比较不同模型表现、了解生态系统动态。近年来，随着开源AI模型的普及和多样化模型架构的出现，对全面、结构化数据的需求日益增长，推动了专门分析工具的发展。AI2025Dev平台延续了这一趋势，专注于2025年AI活动的数据化呈现，为研究者和开发者提供数据驱动的洞察工具。

Marktechpost发布AI2025Dev平台，为AI模型与生态提供结构化数据层

背景阅读

相关阅读

Cloudflare 收购 Human Native 以构建 AI 训练数据新支付模式

OpenAI 推动其 API 格式成为行业标准

Artificial Analysis 全面改革 AI 智能指数，用真实世界测试取代传统基准

评论 (0)