关键功能

基于扩散的视频试戴,具有明确的纹理 3D 网格引导
动态 3D 服装动画的自适应流程
矩形遮蔽策略可防止伪影传播
用于评估的高分辨率 HR-VVT 基准数据集
卓越的时间一致性和服装细节保留
处理复杂的姿势和多样的服装图案

3DV-TON 的核心流程是自适应的、多阶段的。它首先从输入视频中选择一个关键帧,用于初始的 2D 图像试穿。接下来,它会重建并动画化一个与原始视频体态同步的纹理 3D 网格。该网格充当动态引导,告知扩散模型服装应如何在帧间移动和变形。为了进一步提升视觉质量,3DV-TON 采用了强大的矩形遮罩策略,可防止伪影扩散,并降低快速移动过程中服装信息泄露的风险。这确保了即使在具有挑战性的场景下(例如快速运动或身体与服装之间复杂的相互作用),生成的结果也不会出现视觉伪影。


为了支持严格的评估并促进该领域的研究,3DV-TON 引入了 HR-VVT 基准数据集,该数据集包含 130 个高分辨率视频,涵盖了各种服装类型和场景。定量和定性评估表明,3DV-TON 的表现始终优于现有的视频试穿方法,尤其是在时间一致性和服装细节保留方面。该框架创新地结合了扩散建模、3D 网格引导和伪影缓解策略,使其成为逼真、高质量视频试穿的领先解决方案,适用于时尚、电子商务和数字内容创作等领域的应用。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!