ProEdit 引入了 KV-mix,它混合了编辑区域中源和目标的 KV 特征,减轻了源图像对编辑区域的影响,同时保持了背景一致性。它还提出了 Latents-Shift,扰动源潜变量的编辑区域,消除了反演潜变量对采样的影响。这种方法能够同时实现精确的属性编辑和背景保持。
ProEdit 流程包括一个掩码提取模块,该模块在第一次反演步骤中根据源和目标提示识别编辑区域。在获得反演噪声后,应用 Latents-Shift 来扰动初始分布在编辑区域,减少源图像信息。ProEdit 在多项图像和视频编辑基准测试中取得了最先进的性能,并且可以无缝集成到现有的反演和编辑方法中。

