InfiniteYou 的核心是 InfuseNet 模块,这是一个专门的神经组件,它通过残差连接将身份特征注入到扩散过程中。这种方法确保生成的图像与原始主体保持高度相似,即使背景、服装和姿势根据用户提示发生显著变化。该模型采用多阶段训练策略,包括预训练和基于合成单人多样本数据的监督微调,从而增强了文本-图像对齐效果和整体图像美感。InfiniteYou 提供两种模型变体:“aes_stage2”用于改进文本-图像对齐效果和视觉吸引力,“sim_stage1”用于最大程度地提高人脸相似度,让用户能够根据自身需求灵活调整。
InfiniteYou 采用即插即用设计,兼容各种现有的图像生成方法、工具和扩展程序,例如 ControlNets 和 LoRA。该框架支持可选的控制图像用于姿势或结构引导,并提供可调节的参数用于调节比例和引导,从而实现精细的定制化。 InfiniteYou 开源,可用于研究和创意用途,其突出之处在于能够生成高保真、身份一致的图像,具有卓越的真实感和快速对齐功能,在质量和灵活性方面均优于以往的解决方案。
主要功能包括:
- 在所有生成的图像中保留个人身份特征
- 基于文本提示的自定义功能,可灵活更改场景和风格
- 用于高级身份特征注入的 InfuseNet 模块
- 多阶段训练,可改善文本-图像对齐和美观性
- 两种模型变体:aes_stage2(美观性)和 sim_stage1(相似性)
- 与 ControlNets、LoRA 和其他工具即插即用兼容性
- 支持可选的姿势或结构控制图像
- 用于研究和创意应用的开源代码和模型