通过将多模态推理与不断发展的上下文记忆交织在一起,VIGA 可以“感知编码”场景、它们的物理特性和交互,使用基本元素或高质量生成资产从头开始构建它们。
在新的 BlenderBench 基准(包含 30 个具有挑战性的任务)和 BlenderGym 上进行评估,VIGA 显著优于强大的基线,在多样化的图形编辑和程序化内容创建任务中展现出强大的泛化能力。
通过将多模态推理与不断发展的上下文记忆交织在一起,VIGA 可以“感知编码”场景、它们的物理特性和交互,使用基本元素或高质量生成资产从头开始构建它们。
在新的 BlenderBench 基准(包含 30 个具有挑战性的任务)和 BlenderGym 上进行评估,VIGA 显著优于强大的基线,在多样化的图形编辑和程序化内容创建任务中展现出强大的泛化能力。
在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!


Get top updates in AI to your inbox every weekend. It's free!