拥有 81 亿参数的 Large 模型是该系列中最强大的,在提示词遵循度和图像质量方面表现出色。它非常适合概念艺术、故事板和广告等专业用例。Large Turbo 变体是为更快图像生成而优化的精简版本,在更少的计算步骤中产生高质量的结果。另一方面,Medium 模型在图像质量和处理效率之间提供了有竞争力的权衡,适用于寻求性能和资源消耗平衡的用户。这些模型采用了查询键归一化 (Query-Key Normalization) 等先进技术来稳定训练并促进微调,从而提高跨不同应用的性能和适应性。
除了技术进步,Stable Diffusion 3.5 还强调图像生成的多元化,无需大量提示词即可生成代表不同肤色和特征的图像。该许可允许年收入低于 100 万美元的个人和企业免费使用,鼓励广泛采用和商业化,同时保留生成媒体的所有权。用户可以通过 Hugging Face、GitHub 以及各种推理工具(包括用于本地节点式推理的 ComfyUI)访问这些模型,从而为创作者、研究人员和企业创新和集成先进的图像生成功能建立了一个强大的生态系统。

