关键功能

基于稀疏体积的可扩展3D生成框架
用于高效 DiT 计算的空间稀疏注意力 (SSA) 机制
用于一致稀疏体积格式的变分自编码器 (VAE)
卓越的输出质量,降低培训成本
前向传递速度提高 3.9 倍,后向传递速度提高 9.6 倍
仅需 8 个 GPU 即可实现 1024³ 分辨率的训练
适用于计算机视觉、图形和机器人领域的各种应用
实时应用,例如 3D 重建和跟踪

该框架包含一个变分自编码器 (VAE),可在输入、潜在和输出阶段保持一致的稀疏体积格式。这种统一的设计显著提高了训练效率和稳定性。Direct3D-S2 基于公开数据集进行训练,在生成质量和效率方面超越了最先进的方法。它仅需 8 个 GPU 即可实现 1024³ 分辨率的训练,使千兆级 3D 生成变得切实可行且易于上手。


Direct3D-S2 在计算机视觉、图形和机器人技术领域有着广泛的应用。它能够使用体积表示生成高分辨率 3D 形状,使其成为建筑、产品设计和视频制作等各行各业的宝贵工具。该模型的效率和可扩展性也使其非常适合用于实时应用,例如 3D 重建和跟踪。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!