该方法通过根据空 3D 空间中的参考摄像机姿势渲染的摄像机网格来表示摄像机运动。在训练期间,该相机网格与其他控件一起注入到 MMDiT 中,而分层提示扩展代理则在推理时集成多模态信号。
OmniDirector 对于需要复制电影摄像机语言而不仅仅是对象运动的视频生成工作流程非常有用。它可以重现空中飞越、下降、移动变焦、子弹时间效果和类似镜头扭曲的相机行为,同时保留生成的内容。
该方法通过根据空 3D 空间中的参考摄像机姿势渲染的摄像机网格来表示摄像机运动。在训练期间,该相机网格与其他控件一起注入到 MMDiT 中,而分层提示扩展代理则在推理时集成多模态信号。
OmniDirector 对于需要复制电影摄像机语言而不仅仅是对象运动的视频生成工作流程非常有用。它可以重现空中飞越、下降、移动变焦、子弹时间效果和类似镜头扭曲的相机行为,同时保留生成的内容。
在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!


Get top updates in AI to your inbox every weekend. It's free!