出色的 FLUX.2 [klein] 4B 变体采用了一种仅包含 40 亿个参数的整流流变换器(rectified flow transformer),但通过支持多参考编辑(multi-reference editing)而表现出色——它允许用户在混合多个输入图像的同时保持解剖学上的准确性,例如在不同场景中保持一致的手部姿势和面部特征。其精简的架构极大地加速了推理,即使在 VRAM 仅为 13GB 的设备上也能实现亚秒级生成时间,而不会牺牲定义了较大 FLUX 系列的高保真细节。这种性能和资源效率的平衡为以前扩散模型难以企及的边缘部署和本地开发环境开辟了道路。
除了速度之外,FLUX.2 [klein] 在多功能性方面也表现出色,它可以处理复杂的任务,如夜间重新照明、将角色合成到不同的环境中,以及在保持精细细节的前提下进行细粒度编辑。4B 模型以 Apache 2.0 许可证发布,通过开放权重赋能开发者和创作者进行商业用途,从而在实时预览、延迟敏感的生产管线以及有限硬件上的自定义微调等领域促进创新。无论是根据提示生成充满活力的风景,还是以手术般的精确度来完善照片,该模型都重新定义了可访问的高性能视觉 AI 所能实现的范围。

