超参数科技推出COTA游戏智能体,由大模型驱动实现实时决策

7 小时前·来源:量子位
游戏AI大模型智能体实时决策思维链

超参数科技发布了全新游戏智能体COTA,该产品由大模型原生驱动。COTA在FPS游戏中实现了实时高频决策,推理链路全程清晰可见。它通过模拟人类快慢思考过程,在复杂游戏场景中表现出职业级水准。

超参数科技推出了一款全新的游戏智能体COTA。据官方描述,这是一款真正具备通用游戏潜力的Agent产品,强调认知、执行、策略和辅助。COTA的操作堪比职业选手,决策比肩教练级,推理链路全程清晰可见,并且这一切完全由大模型原生驱动。

目前COTA可以在官方自研的FPS游戏Demo中进行体验。该类型游戏容错率极低,要求AI必须在每一帧内不断识别敌人、判断地形、规划路径并进行射击反馈。游戏分为进攻方和防守方两队,每队5人。

在观战模式下,玩家可以查看双方队伍的简易思维链,再点击一次即可开启详细CoT过程。角色视角下,可查看当前角色所在队伍的Commander下发给该角色的团队战略以及个人任务,同样双击O键查看详细CoT内容。每个详细CoT推导过程的右下角都设置有暂停和播放按键。

以守方Apple为视角,团队Commander首先根据A、B两个据点的不同地势情况,合理分配人员。A点三人控夹角,B点两人守高台,保持视野联动。比赛正式开始,Apple听从Commander的单人指令,前往B点架枪防守。通过查看Apple的CoT可知,该Agent先对指令内容进行拆解,结合当前坐标和目标点坐标,以及附近地图环境,规划出合理的转移路径。移动时,输出的决策也相当全面,始终强调动作的连续性与拟人性,既模拟真实玩家的操作过程,又可以避免暴露自己的位置。

移动过程中,Agent也会即时感知当前页面,接收并向队伍反馈实时信息。除了推理可视化外,在急停拉枪、掩体博弈、投掷物封烟、下包拆包等一系列复杂动作上,Agent也表现得相当流畅自然。在团队配合时,Agent也会有意识配合完成集火包抄,掩护队友完成单点突破。

在单人模式中,玩家可以与4个AI一起组队对抗5个AI。作为攻方,几乎可以无脑跟AI指令,队友会在前面开路。和AI打一盘下来,完全感觉不到是在和AI匹配组队,指令清晰易懂,反馈及时,也几乎不存在打人机局时的机械感。

无论是哪种模式下,Agent的表现都比肩人类顶尖玩家,作为队员,它能把每一个指令完美消化,配合度满分;而作为队长,它又可以实时制定最详细的战术策略。赢下比赛也并非依靠超越人类的反应速度,而是通过策略运营,借助类似人类选手的意识获胜。

传统FPS的AI Bot通常只能满足实时性和操作精度,但在战术博弈和高层决策上对抗能力弱,更依赖预设脚本。而AlphaGo则受限于强化学习范式,虽然在对抗上表现优异,但却是一个思维黑盒。COTA通过精准选型和对模型架构的进一步创新,从而找到了平衡点。

为了避免参数冗余,COTA采用Qwen3-VL-8B-Thinking作为基座模型,这是一个兼顾性能与效率的选择。相比更小参数量级的模型,8B仍然可支撑足够的逻辑链推理,以及理解复杂的游戏战术;体积轻巧也能更好地满足游戏场景中每秒多次的决策刷新。

背景阅读

游戏AI的发展经历了多个阶段。早期游戏中的AI通常基于规则系统或有限状态机,行为模式固定且可预测。随着机器学习技术的进步,强化学习被广泛应用于游戏AI,如DeepMind的AlphaGo在围棋领域取得突破性成就,通过自我对弈学习策略。然而,这类方法往往形成“黑盒”系统,决策过程不透明。 近年来,大型语言模型(LLM)的兴起为游戏AI带来了新的可能性。LLM具备强大的自然语言理解和推理能力,能够处理复杂指令并生成连贯的决策链。将LLM应用于游戏智能体,可以实现更灵活、更拟人化的行为,同时通过思维链技术使决策过程可视化,增强可解释性。 超参数科技作为国内专注于游戏AI的创业公司,此前已在多款游戏中部署AI Agent。COTA的推出标志着游戏AI向大模型驱动、实时决策、透明推理的方向发展,有望在电子竞技、游戏测试、玩家陪练等场景中实现商业化应用。

评论 (0)

登录后参与评论

加载评论中...