寻找最新最佳的音视频生成人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Ovi 是一个先进的音视频生成系统,仅从文本或文本与图像的组合作为输入,即可创建同步的视频剪辑。它包含一个基于镜像双骨干架构的高质量预训练 50 亿参数音频模型,以及一个 10 亿参数的融合分支。该系统擅长为视频内容生成精确的唇形同步,而无需明确的面部边界框,这完全是通过数据驱动的学习方法实现的。
这项尖端技术自然支持多说话人和多轮