NeoBeta - AI 科技资讯

超参数科技推出了一款全新的游戏智能体COTA。据官方描述，这是一款真正具备通用游戏潜力的Agent产品，强调认知、执行、策略和辅助。COTA的操作堪比职业选手，决策比肩教练级，推理链路全程清晰可见，并且这一切完全由大模型原生驱动。

目前COTA可以在官方自研的FPS游戏Demo中进行体验。该类型游戏容错率极低，要求AI必须在每一帧内不断识别敌人、判断地形、规划路径并进行射击反馈。游戏分为进攻方和防守方两队，每队5人。

在观战模式下，玩家可以查看双方队伍的简易思维链，再点击一次即可开启详细CoT过程。角色视角下，可查看当前角色所在队伍的Commander下发给该角色的团队战略以及个人任务，同样双击O键查看详细CoT内容。每个详细CoT推导过程的右下角都设置有暂停和播放按键。

以守方Apple为视角，团队Commander首先根据A、B两个据点的不同地势情况，合理分配人员。A点三人控夹角，B点两人守高台，保持视野联动。比赛正式开始，Apple听从Commander的单人指令，前往B点架枪防守。通过查看Apple的CoT可知，该Agent先对指令内容进行拆解，结合当前坐标和目标点坐标，以及附近地图环境，规划出合理的转移路径。移动时，输出的决策也相当全面，始终强调动作的连续性与拟人性，既模拟真实玩家的操作过程，又可以避免暴露自己的位置。

移动过程中，Agent也会即时感知当前页面，接收并向队伍反馈实时信息。除了推理可视化外，在急停拉枪、掩体博弈、投掷物封烟、下包拆包等一系列复杂动作上，Agent也表现得相当流畅自然。在团队配合时，Agent也会有意识配合完成集火包抄，掩护队友完成单点突破。

在单人模式中，玩家可以与4个AI一起组队对抗5个AI。作为攻方，几乎可以无脑跟AI指令，队友会在前面开路。和AI打一盘下来，完全感觉不到是在和AI匹配组队，指令清晰易懂，反馈及时，也几乎不存在打人机局时的机械感。

无论是哪种模式下，Agent的表现都比肩人类顶尖玩家，作为队员，它能把每一个指令完美消化，配合度满分；而作为队长，它又可以实时制定最详细的战术策略。赢下比赛也并非依靠超越人类的反应速度，而是通过策略运营，借助类似人类选手的意识获胜。

传统FPS的AI Bot通常只能满足实时性和操作精度，但在战术博弈和高层决策上对抗能力弱，更依赖预设脚本。而AlphaGo则受限于强化学习范式，虽然在对抗上表现优异，但却是一个思维黑盒。COTA通过精准选型和对模型架构的进一步创新，从而找到了平衡点。

为了避免参数冗余，COTA采用Qwen3-VL-8B-Thinking作为基座模型，这是一个兼顾性能与效率的选择。相比更小参数量级的模型，8B仍然可支撑足够的逻辑链推理，以及理解复杂的游戏战术；体积轻巧也能更好地满足游戏场景中每秒多次的决策刷新。

超参数科技推出COTA游戏智能体，由大模型驱动实现实时决策

背景阅读

相关阅读

谷歌扩展Gemini为世界模型，模拟现实以规划与想象

Gemma 3n 预览版发布：专为移动设备优化的高效多模态AI模型

Gemini 2.5 模型更新：引入 Deep Think 增强推理模式

评论 (0)