寻找最新最佳的动作人工智能。浏览最全面的AI数据库,每日持续更新。
最新
VideoMDM 是一个基于扩散的框架,可在 2D 监督下生成 3D 人体动作。它直接从单目视频中提取的精确 2D 姿态学习 3D 人体动作先验,从而避免训练时依赖真实 3D 动作捕捉真值。
该方法使用预训练的 2D 到 3D 提升器作为带噪教师,对提升结果进行扩散,并通过 2D 重投影损失监督去噪。页面介绍了深度加权重投影、速度
Matrix-Game 3.0 是一个专为实时和流媒体视频生成而构建的交互式世界模型。该项目专注于生成 720p 的长格式输出,同时保留长期内存,这使其与交互式模拟、游戏和高级生成视频工作流程相关。它的框架表明我们努力使世界模型在真实场景中更可用,而不仅仅是受控演示。
该项目页面强调了数据、模型设计和推理方面的改进,包括结合了虚幻