InfinityStar 在图像和视频生成基准测试中取得了最先进的性能,大幅超越了所有自回归模型,甚至超过了 HunyuanVideo 等扩散模型竞争对手。它比领先的基于扩散的方法快大约 10 倍。该框架还能够生成工业级的 720p 视频,为其类别设定了新的质量标准。InfinityStar 的统一建模方法使其能够轻松高效地处理各种生成任务。
InfinityStar 项目提供了一个用于训练和微调模型的全面工作流程,涵盖数据组织、特征提取和训练脚本。该框架是用 Python 实现的,并使用 FlexAttention 来加速训练。该项目还包括一个演示网站供用户试用 InfinityStar 和生成视频。演示网站展示了该框架的能力,并提供了一种有趣的互动方式来体验这项技术。

