超参数科技推出了一款全新的游戏智能体COTA。据官方描述,这是一款真正具备通用游戏潜力的Agent产品,强调认知、执行、策略和辅助。COTA的操作堪比职业选手,决策比肩教练级,推理链路全程清晰可见,并且这一切完全由大模型原生驱动。
目前COTA可以在官方自研的FPS游戏Demo中进行体验。该类型游戏容错率极低,要求AI必须在每一帧内不断识别敌人、判断地形、规划路径并进行射击反馈。游戏分为进攻方和防守方两队,每队5人。
在观战模式下,玩家可以查看双方队伍的简易思维链,再点击一次即可开启详细CoT过程。角色视角下,可查看当前角色所在队伍的Commander下发给该角色的团队战略以及个人任务,同样双击O键查看详细CoT内容。每个详细CoT推导过程的右下角都设置有暂停和播放按键。
以守方Apple为视角,团队Commander首先根据A、B两个据点的不同地势情况,合理分配人员。A点三人控夹角,B点两人守高台,保持视野联动。比赛正式开始,Apple听从Commander的单人指令,前往B点架枪防守。通过查看Apple的CoT可知,该Agent先对指令内容进行拆解,结合当前坐标和目标点坐标,以及附近地图环境,规划出合理的转移路径。移动时,输出的决策也相当全面,始终强调动作的连续性与拟人性,既模拟真实玩家的操作过程,又可以避免暴露自己的位置。
移动过程中,Agent也会即时感知当前页面,接收并向队伍反馈实时信息。除了推理可视化外,在急停拉枪、掩体博弈、投掷物封烟、下包拆包等一系列复杂动作上,Agent也表现得相当流畅自然。在团队配合时,Agent也会有意识配合完成集火包抄,掩护队友完成单点突破。
在单人模式中,玩家可以与4个AI一起组队对抗5个AI。作为攻方,几乎可以无脑跟AI指令,队友会在前面开路。和AI打一盘下来,完全感觉不到是在和AI匹配组队,指令清晰易懂,反馈及时,也几乎不存在打人机局时的机械感。
无论是哪种模式下,Agent的表现都比肩人类顶尖玩家,作为队员,它能把每一个指令完美消化,配合度满分;而作为队长,它又可以实时制定最详细的战术策略。赢下比赛也并非依靠超越人类的反应速度,而是通过策略运营,借助类似人类选手的意识获胜。
传统FPS的AI Bot通常只能满足实时性和操作精度,但在战术博弈和高层决策上对抗能力弱,更依赖预设脚本。而AlphaGo则受限于强化学习范式,虽然在对抗上表现优异,但却是一个思维黑盒。COTA通过精准选型和对模型架构的进一步创新,从而找到了平衡点。
为了避免参数冗余,COTA采用Qwen3-VL-8B-Thinking作为基座模型,这是一个兼顾性能与效率的选择。相比更小参数量级的模型,8B仍然可支撑足够的逻辑链推理,以及理解复杂的游戏战术;体积轻巧也能更好地满足游戏场景中每秒多次的决策刷新。