关键功能

采用开放训练配方的 30 亿参数文生图扩散模型。
面向与领先开源权重模型竞争的 1024 分辨率图像生成。
通过受控实验研究建模选择。
分析文本条件、噪声条件和骨干架构决策。
研究包括合成字幕、提示词改写和数据集混合在内的数据选择。
报告了 GenEval、DPG-Bench、PRISM、CVTG-2K 和 LongText-Bench 上的评估。
根据项目页面发布了模型、代码和数据。
既可作为模型使用,也可作为文生图训练研究配方参考。

项目研究了模型设计、文本与噪声条件、骨干架构、合成字幕、提示词改写、数据集混合以及训练与评估选择。它把开放性作为核心贡献之一,通过发布模型、代码和数据来支持可控的后续研究。


i1 适合希望理解究竟哪些具体设计选择推动文生图质量提升的研究者,而不仅仅是使用一个成品模型。项目页面链接了论文、代码、模型和数据资源。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!