PUSA V1.0 为图像到视频 (I2V) 生成树立了新的标准,其 VBench-I2V 总分为 87.32%。此外,PUSA 还解锁了许多零样本多任务功能,例如起始帧和视频扩展,所有这些功能都无需针对特定任务进行训练。该模型还可以执行文本转视频生成,使其成为适用于各种应用的多功能工具。PUSA 的效率和功能使其成为研究和工业界都极具吸引力的解决方案,使高保真视频生成变得大众化。
PUSA V1.0 模型旨在实现可扩展、高效和多功能,适用于广泛的应用。该模型能够在保留基础模型生成先验知识的同时注入时间动态特性,从而能够以更少的计算资源生成高质量的视频。PUSA 的性能和效率使其成为视频合成领域一项激动人心的进展,在视频编辑、长视频生成等领域具有潜在的应用前景。