该系统使用结构化去噪动力学来引导扩散过程从粗略的几何对齐到最终的照片级真实感外观。这种分阶段的去噪行为有助于模型尽早尊重可用的几何形状,同时稍后细化纹理、运动和场景外观。 MoCam同时支持静态和动态场景,使其比假设刚性环境或完美重建的视图合成方法更广泛。
MoCam 对于视频编辑、虚拟摄像机控制、3D 感知生成、电影重新取景以及基于扩散的新颖视图合成的研究非常有用。它的价值在于实用的鲁棒性:即使输入几何体对于传统渲染来说不够完整,用户也可以应用相机变换。该项目是一个免费的学术研究版本,包含演示以及即将发布的 GitHub 和模型资源。

