InfiniteYou

InfiniteYou 的核心是 InfuseNet 模块，这是一个专门的神经组件，它通过残差连接将身份特征注入到扩散过程中。这种方法确保生成的图像与原始主体保持高度相似，即使背景、服装和姿势根据用户提示发生显著变化。该模型采用多阶段训练策略，包括预训练和基于合成单人多样本数据的监督微调，从而增强了文本-图像对齐效果和整体图像美感。InfiniteYou 提供两种模型变体：“aes_stage2”用于改进文本-图像对齐效果和视觉吸引力，“sim_stage1”用于最大程度地提高人脸相似度，让用户能够根据自身需求灵活调整。

InfiniteYou 采用即插即用设计，兼容各种现有的图像生成方法、工具和扩展程序，例如 ControlNets 和 LoRA。该框架支持可选的控制图像用于姿势或结构引导，并提供可调节的参数用于调节比例和引导，从而实现精细的定制化。 InfiniteYou 开源，可用于研究和创意用途，其突出之处在于能够生成高保真、身份一致的图像，具有卓越的真实感和快速对齐功能，在质量和灵活性方面均优于以往的解决方案。

主要功能包括：

在所有生成的图像中保留个人身份特征
基于文本提示的自定义功能，可灵活更改场景和风格
用于高级身份特征注入的 InfuseNet 模块
多阶段训练，可改善文本-图像对齐和美观性
两种模型变体：aes_stage2（美观性）和 sim_stage1（相似性）
与 ControlNets、LoRA 和其他工具即插即用兼容性
支持可选的姿势或结构控制图像
用于研究和创意应用的开源代码和模型

Subscribe to the AI Search Newsletter