NVIDIA 的 AI-Q 蓝本在 Hugging Face DeepResearch Bench 的“LLM with Search”排行榜中位列第一。AI-Q 是一个便携式开源深度研究代理,融合了 Llama 3.3-70B Instruct 和 Llama-3.3-Nemotron-Super-49B-v1.5 两个高性能开源大语言模型。Llama 3.3-70B Instruct 基于 Meta 的 Llama 系列,用于流畅的结构化报告生成。Llama-3.3-Nemotron-Super-49B-v1.5 是一个优化推理变体,通过神经架构搜索、知识蒸馏和监督与强化学习训练,擅长多步推理、查询规划和工具使用。AI-Q 参考示例还包括 NVIDIA NeMo Retriever 用于可扩展的多模态搜索,以及 NVIDIA NeMo Agent 工具包用于编排复杂的多步代理工作流。该架构支持对本地和网络数据的并行低延迟搜索,适用于需要隐私、合规或本地部署的场景。NVIDIA Llama Nemotron Super 经过后训练,支持通过系统提示切换推理模式,可用于标准聊天或深度链式推理。该模型具有 490 亿参数,上下文窗口高达 128K 令牌,可在单个 H100 GPU 上运行。AI-Q 强调透明度,包括推理痕迹和中间步骤的可视化,开发中使用了幻觉检测、多源合成和引用可信度等指标。DeepResearch Bench 使用一组评估代理堆栈。