关键功能

用于细粒度时间控制的矢量化时间步长自适应(VTA)
在注入时间动态的同时保留基础模型的生成先验
图像到视频 (I2V) 生成效率空前
针对起始帧和视频扩展的零样本多任务功能
文本到视频生成功能
可扩展、高效且多功能的设计
适用于研究和工业应用
使高保真视频生成民主化

PUSA V1.0 为图像到视频 (I2V) 生成树立了新的标准,其 VBench-I2V 总分为 87.32%。此外,PUSA 还解锁了许多零样本多任务功能,例如起始帧和视频扩展,所有这些功能都无需针对特定任务进行训练。该模型还可以执行文本转视频生成,使其成为适用于各种应用的多功能工具。PUSA 的效率和功能使其成为研究和工业界都极具吸引力的解决方案,使高保真视频生成变得大众化。


PUSA V1.0 模型旨在实现可扩展、高效和多功能,适用于广泛的应用。该模型能够在保留基础模型生成先验知识的同时注入时间动态特性,从而能够以更少的计算资源生成高质量的视频。PUSA 的性能和效率使其成为视频合成领域一项激动人心的进展,在视频编辑、长视频生成等领域具有潜在的应用前景。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!