SIMA 2 的新架构集成了 Gemini 强大的推理能力,以帮助它理解用户的宏观目标、在追求目标过程中进行复杂的推理,并在游戏内熟练地执行面向目标的动作。该智能体可以理解并完成长期而复杂的任务,其迁移所学概念的能力是实现人类认知中那种广泛泛化能力的基础。在广泛的任务中,SIMA 2 的表现显著接近于人类玩家的表现。
SIMA 2 跨越多样化游戏环境的能力是检验通用智能的关键试金石,它使智能体能够掌握技能、练习复杂推理,并通过自我指导的游戏不断学习。该智能体的自我改进周期始于 Gemini 为 SIMA 2 的行为提供初始任务和估计的奖励,然后这些信息被添加到一个自我生成的经验库中,用于后续世代的进一步训练。这个过程使智能体能够完全独立于人类生成的演示和干预,改进先前失败的任务。

