Wan2.2 是一个开放且先进的大规模视频生成模型，它将混合专家 (MoE) 架构引入视频扩散模型。该架构利用强大的专业模型，将去噪过程在不同时间步长上分离，从而在保持相同计算成本的同时提升了模型的整体容量。Wan2.2 还整合了精心挑选的美学数据，并附有光照、构图、对比度、色调等详细标签，从而实现更精准、更可控的电影风格生成。\nWan2.2 的训练数据集

Wan 2.2 | 寻找最新最热门的视频AI | 浏览最全面的AI数据库

Wan2.2 是一个开放且先进的大规模视频生成模型，它将混合专家 (MoE) 架构引入视频扩散模型。该架构利用强大的专业模型，将去噪过程在不同时间步长上分离，从而在保持相同计算成本的同时提升了模型的整体容量。Wan2.2 还整合了精心挑选的美学数据，并附有光照、构图、对比度、色调等详细标签，从而实现更精准、更可控的电影风格生成。 \nWan2.2 的训练数据集比其前身 Wan2.1 大得多，图像数量增加了 65.6%，视频数量增加了 83.2%。这一扩展增强了模型在运动、语义和美学等多个维度上的泛化能力，在所有开源和闭源模型中均达到了顶级性能。该模型还支持 720P 分辨率、24fps 的文本转视频和图像转视频，并可在 4090 等消费级显卡上运行。 \nWan2.2 开源了一个基于先进的 Wan2.2-VAE 构建的 5B 模型，压缩比达到 16×16×4。该模型支持 720P 分辨率、24fps 的文本转视频和图像转视频，并可在 4090 等消费级显卡上运行。它是目前最快的 720P@24fps 模型之一，能够同时服务于工业界和学术界。该模型还兼容各种框架和工具，包括 PyTorch、Hugging Face 和 ModelScope。

Wan 2.2

关键功能

Subscribe to the AI Search Newsletter