Diffuman4D 提出的方法利用时空扩散模型解决了从稀疏视角视频合成真人新视角的难题。该模型使用骨架-普吕克条件,其中编码的骨架潜在特征和普吕克坐标与输入视角的图像潜在特征或目标视角的噪声潜在特征连接在一起。所有视图和时间戳的样本构成一个样本网格,模型使用滑动迭代机制对其进行去噪,然后将其解码为目标视频。
Diffuman4D 通过生成以输入视频为条件的 4D 一致性多视图视频来解决稀疏视图难题。生成的视频支持高质量的 4DGS 重建,从而实现对运动中人体的自由视图渲染。该方法已被证明能够产生高保真结果,并有可能应用于电影、视频游戏和虚拟现实等各种应用领域。Diffuman4D 方法是 4D 人体视图合成领域的重要一步。