寻找最新最佳的世界模特人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Waypoint 1.5 是 Overworld 的实时 AI 世界模型,旨在将交互式生成的世界带入日常 GPU。它专注于通过减少通常与高端生成环境相关的硬件障碍,使世界模拟变得更容易。该产品面向那些想要实时世界而不依赖昂贵的工作站规模推理的创作者、开发者和研究人员。
该系统围绕实时世界生成和运行时效率进行了优化,使用模型和渲染改
Inspatio World 是一个实时交互式 4D 世界模型,可将参考视频转变为动态可探索环境。它专为那些想要超越被动视频播放并与场景进行交互的用户而设计,就好像它是一个可导航的世界一样。该系统与世界模拟、沉浸式媒体、机器人评估和人工智能生成的环境相关。
该产品使用参考视频驱动的世界建模方法,其中输入视频充当场景动态、外观和空间
Multiworld 是一种可扩展的多代理、多视图视频世界模型,旨在模拟多个代理同时行动且必须在多个摄像机视图之间保持一致的环境。它超越了单代理世界建模,专注于协调行为、共享场景状态和动作可控视频生成。这使得它对于多人游戏、多机器人操作以及交互式模拟环境的研究非常有用。
该系统引入了用于精确控制多个代理的多代理条件模块和用于跨视图
HY World 2.0是腾讯混元开源的多模态世界模型,用于重建、生成和模拟3D世界。它被设计为一个广泛的世界建模框架,可以跨模式推理并生成结构化的 3D 世界输出。该产品与游戏、机器人、虚拟生产、数字孪生和实体人工智能相关。
该系统将多模式输入与 3D 世界建模相结合,使其能够重建现有环境、生成新环境并支持模拟工作流程。从技术上
Lyra 2 是一款用于探索生成 3D 世界的 NVIDIA 研究系统。它旨在创建摄像机控制的演练视频,并通过前馈重建将其提升为 3D。该产品的目标是长视野、3D 一致的世界生成,用户可以探索生成的环境,而不仅仅是观看固定的剪辑。
该系统解决了空间遗忘和时间漂移,这是长时间生成的演练中的两个常见问题。通过将生成与 3D 重建相结合
混合内存是一种用于改善动态视频世界模型中的内存的研究系统。它旨在帮助生成的世界记住稳定的场景信息和随时间变化的动态状态。这对于长视距视频模拟很重要,因为模型经常会忘记对象、在空间上漂移或随着世代的扩展而失去连续性。
该系统使用混合记忆方法,可能将短期动态记忆与长期场景或世界状态表示相结合。从技术上讲,这允许视频世界模型保留持久结构
Matrix-Game 3.0 是一个专为实时和流媒体视频生成而构建的交互式世界模型。该项目专注于生成 720p 的长格式输出,同时保留长期内存,这使其与交互式模拟、游戏和高级生成视频工作流程相关。它的框架表明我们努力使世界模型在真实场景中更可用,而不仅仅是受控演示。
该项目页面强调了数据、模型设计和推理方面的改进,包括结合了虚幻
首尔世界模型是一个城市规模的世界模拟系统,以真实的城市环境为基础进行建模。它旨在代表大都市随时间的变化方式,这使得它对于导航、规划、模拟和具体人工智能场景非常有用。该产品之所以引人注目,是因为它将世界建模推向了更加现实和可操作的环境。
通过以实时城市环境为中心,系统可以捕获更简单的基准环境经常忽略的复杂性。交通、行人、不断变化的条