MongoDB发布Voyage 4嵌入模型,提升企业AI检索质量

4 天前·来源:VentureBeat
MongoDB嵌入模型AI检索企业AIRAG

MongoDB发布了四款新的嵌入和重排模型,包括Voyage 4系列。这些模型旨在解决AI系统在生产环境中检索质量下降的问题。Voyage-4-nano是该公司首款开源权重模型,所有模型可通过API和Atlas平台使用。

Agentic系统和企业搜索依赖于高效准确的数据检索。数据库提供商MongoDB认为其最新的嵌入模型有助于解决更多AI系统投入生产后检索质量下降的问题。随着Agentic和RAG系统进入生产环境,检索质量正成为一个潜在的失败点,即使模型本身表现良好,也可能影响准确性、成本和用户信任。

MongoDB发布了四款新的嵌入和重排模型。Voyage 4将提供四种模式:voyage-4嵌入、voyage-4-large、voyage-4-lite和voyage-4-nano。MongoDB表示,voyage-4嵌入是其通用模型;Voyage-4-large被视为旗舰模型。Voyage-4-lite专注于低延迟和低成本任务,voyage-4-nano则适用于本地开发测试环境或设备端数据检索。

Voyage-4-nano也是MongoDB的首款开源权重模型。所有模型可通过API和MongoDB的Atlas平台使用。该公司表示,这些模型在RTEB基准测试中优于Google和Cohere的类似模型。Hugging Face的RTEB基准测试将Voyage 4列为顶级嵌入模型。

MongoDB还发布了一款新的多模态嵌入模型voyage-multimodal-3.5,可处理包含文本、图像和视频的文档。该模型将数据向量化,并从企业文档中常见的表格、图形、图表和幻灯片中提取语义含义。

对于企业而言,Agentic系统的有效性取决于其能否在正确时间可靠检索正确信息。随着工作负载扩展和上下文窗口碎片化,这一要求变得更加困难。MongoDB表示,许多客户发现其数据堆栈无法在生产环境中处理上下文感知、检索密集型工作负载。该公司观察到更多碎片化情况,企业不得不整合不同解决方案以连接数据库与检索或重排模型。

背景阅读

嵌入模型是AI领域中的关键技术,用于将文本、图像等数据转换为向量表示,以便进行语义搜索和检索。随着企业AI应用如RAG(检索增强生成)和Agentic系统的普及,高效的数据检索变得至关重要,因为检索质量直接影响AI系统的准确性和用户体验。近年来,多家公司如Google、Cohere和Mistral都推出了嵌入模型,竞争激烈。MongoDB作为数据库提供商,通过发布Voyage系列模型,旨在解决企业在生产环境中面临的检索挑战,特别是数据碎片化和性能问题。嵌入模型的进步有助于提升企业AI的可信度和实用性,减少幻觉现象,并优化成本效益。

评论 (0)

登录后参与评论

加载评论中...