关键功能

亚秒级推理,用于实时图像生成和编辑
统一架构,支持文本到图像和多参考图像编辑
可在具有约 13GB VRAM 的消费级 GPU 上高效运行
40 亿参数的整流流变换器,实现紧凑的高质量输出
Apache 2.0 许可证下的开放权重,可用于商业应用
针对交互式工作流程和延迟关键的生产用途进行了优化
处理复杂编辑,如手部姿势、面部保真度和重新照明
适用于本地开发、边缘部署和微调

出色的 FLUX.2 [klein] 4B 变体采用了一种仅包含 40 亿个参数的整流流变换器(rectified flow transformer),但通过支持多参考编辑(multi-reference editing)而表现出色——它允许用户在混合多个输入图像的同时保持解剖学上的准确性,例如在不同场景中保持一致的手部姿势和面部特征。其精简的架构极大地加速了推理,即使在 VRAM 仅为 13GB 的设备上也能实现亚秒级生成时间,而不会牺牲定义了较大 FLUX 系列的高保真细节。这种性能和资源效率的平衡为以前扩散模型难以企及的边缘部署和本地开发环境开辟了道路。


除了速度之外,FLUX.2 [klein] 在多功能性方面也表现出色,它可以处理复杂的任务,如夜间重新照明、将角色合成到不同的环境中,以及在保持精细细节的前提下进行细粒度编辑。4B 模型以 Apache 2.0 许可证发布,通过开放权重赋能开发者和创作者进行商业用途,从而在实时预览、延迟敏感的生产管线以及有限硬件上的自定义微调等领域促进创新。无论是根据提示生成充满活力的风景,还是以手术般的精确度来完善照片,该模型都重新定义了可访问的高性能视觉 AI 所能实现的范围。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!