关键功能

引入像素空间流模型的秩不对称速度参数化。
将噪声预测限制在低秩子空间,同时保留全维数据预测。
无需改变采样程序即可分析恢复全维速度。
支持从预训练的潜在流模型进行潜在到像素的微调。
改善低级视觉细节,同时保留高级语义结构。
报告强大的 ImageNet 256x256 FID 像素生成性能。
演示 AsymFLUX 风格的文本到图像生成改进。
针对可扩展图像生成研究和高效模型微调。

该方法从不对称预测结构中分析恢复全维流速,而不需要不同的网络架构或新的采样程序。这使得 AsymFlow 成为基于流的图像模型的实用升级路径。它还支持潜在到像素的微调,其中预训练的潜在流模型可以初始化为像素空间模型,然后进行细化以获得更强的低级细节和保真度。


AsymFlow 对于图像生成研究人员和模型构建者非常有用,他们希望在不放弃可扩展性的情况下获得像素空间生成的视觉丰富性。该项目报告了强大的 ImageNet FID 结果以及将 FLUX 式潜在模型微调为像素生成器的改进。它最好被归类为一种用于改进文本到图像和像素空间扩散或流动系统的免费研究方法。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!