MAGI-1 的一个显著特点是其分块提示系统,它使用户能够修改每个片段的视频参数和内容,从而对动作、风格和场景转换进行精细控制。这使得创作者能够无限延长视频长度,实现流畅的叙事流程,并在视频生成过程中应用实时编辑或特效。该模型支持多种生成模式,包括文本转视频、图像转视频和视频转视频,同时保持高度的时间一致性和逼真的物理动态。MAGI-1 的架构融合了先进的扩散技术、块因果注意力机制和并行注意力模块,从而实现了卓越的运动质量、空间连贯性和高效的解码。
MAGI-1 完全开源,并根据 Apache 2.0 许可证分发,可供个人和商业项目免费使用。该代码库包含预训练的权重、推理代码和全面的文档,使开发者和创作者可以轻松地将模型集成到他们的工作流程中。 MAGI-1 支持高清视频(最高可达 1280×720,帧率为 24 FPS),支持 MP4 格式输出,并且每次运行可生成长达 30 秒的视频,对于寻求先进、可定制视频生成工具的用户而言,MAGI-1 堪称领先的解决方案。其在身体行为预测和指导跟踪方面的强大性能,使其成为开源和闭源替代方案的强劲竞争对手。