该框架采用协同姿态调制模块(Synergistic Pose Modulation Modules)来生成自适应且连贯的姿态表示,该表示与参考图像高度兼容。这使得可以直接从参考状态生成高保真且连贯的视频。SteadyDancer还利用分阶段解耦目标训练管道(Staged Decoupled-Objective Training Pipeline),分层优化模型的运动保真度、视觉质量和时间一致性。
SteadyDancer已在各种基准测试中进行了评估,包括X-Dance和RealisDance-Val基准测试。这些基准测试侧重于时空错位、视觉身份保留、时间一致性和运动精度。结果表明,SteadyDancer在外观保真度和运动控制方面均实现了最先进的性能,同时所需的训练资源明显少于同类方法。这使其成为人类图像动画任务中强大而高效的解决方案。

