Ctrl-Crash 旨在生成逼真的车祸场景,由于大多数驾驶数据集中事故事件稀缺,因此这是一项具有挑战性的任务。该模型结合使用边界框、碰撞类型和初始图像帧来生成逼真的碰撞场景。该模型还可以生成反事实场景,其中输入的微小变化可能导致截然不同的结果。这一特性使 Ctrl-Crash 成为交通安全和事故重建等应用领域的宝贵工具。
Ctrl-Crash 已在包括 FVD 和 JEDi 在内的多项指标上进行了评估,并取得了最佳性能。该模型还与 Cosmos、Sora、AVD2、DrivingGen 和 Ctrl-V 等其他方法进行了比较,并在视频质量和物理真实感方面超越了它们。该模型能够生成逼真的车祸和反事实场景,使其成为交通安全、事故重建和自动驾驶汽车开发等各种应用领域的宝贵工具。