Agentic系统和企业搜索依赖于高效准确的数据检索。数据库提供商MongoDB认为其最新的嵌入模型有助于解决更多AI系统投入生产后检索质量下降的问题。随着Agentic和RAG系统进入生产环境,检索质量正成为一个潜在的失败点,即使模型本身表现良好,也可能影响准确性、成本和用户信任。
MongoDB发布了四款新的嵌入和重排模型。Voyage 4将提供四种模式:voyage-4嵌入、voyage-4-large、voyage-4-lite和voyage-4-nano。MongoDB表示,voyage-4嵌入是其通用模型;Voyage-4-large被视为旗舰模型。Voyage-4-lite专注于低延迟和低成本任务,voyage-4-nano则适用于本地开发测试环境或设备端数据检索。
Voyage-4-nano也是MongoDB的首款开源权重模型。所有模型可通过API和MongoDB的Atlas平台使用。该公司表示,这些模型在RTEB基准测试中优于Google和Cohere的类似模型。Hugging Face的RTEB基准测试将Voyage 4列为顶级嵌入模型。
MongoDB还发布了一款新的多模态嵌入模型voyage-multimodal-3.5,可处理包含文本、图像和视频的文档。该模型将数据向量化,并从企业文档中常见的表格、图形、图表和幻灯片中提取语义含义。
对于企业而言,Agentic系统的有效性取决于其能否在正确时间可靠检索正确信息。随着工作负载扩展和上下文窗口碎片化,这一要求变得更加困难。MongoDB表示,许多客户发现其数据堆栈无法在生产环境中处理上下文感知、检索密集型工作负载。该公司观察到更多碎片化情况,企业不得不整合不同解决方案以连接数据库与检索或重排模型。