寻找最新最佳的一代人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Direct3D-S2 是一个基于稀疏体积的可扩展 3D 生成框架,可在显著降低训练成本的同时实现卓越的输出质量。它引入了空间稀疏注意力 (SSA) 机制,显著提升了扩散变换器 (DiT) 在稀疏体积数据上的计算效率。这使得模型能够有效地处理稀疏体积内的大型标记集,使前向传播速度提升 3.9 倍,后向传播速度提升 9.6 倍。
AccVideo 是一个新一代框架,旨在显著加速视频扩散模型的推理,且不牺牲输出质量。传统的视频扩散模型以其生成高质量逼真视频的能力而闻名,但其迭代去噪过程通常需要大量的推理步骤,导致生成时间长且计算成本高昂。AccVideo 通过引入一种新颖的蒸馏方法解决了这一瓶颈。该方法利用合成数据集,使模型能够从多个高效的去噪轨迹中学习。这种方法消除了冗余数据点
Video-T1 是一个开创性的框架,它将测试时间缩放 (TTS) 引入视频生成领域,显著提升了生成视频的质量和一致性。与仅依赖模型大小和训练数据的传统方法不同,Video-T1 在推理时利用额外的计算资源来优化视频创建过程。通过将视频生成视为搜索问题,Video-T1 探索了更广泛的可能视频轨迹,从而生成与用户提示更加一致且视觉保真度更高的输出。这种