寻找最新最佳的开放模型人工智能。浏览最全面的AI数据库,每日持续更新。
最新
Stable Audio Open 是 Stability AI 开发的一款先进的文本转音频模型,旨在根据文本提示生成 44.1kHz 的高品质立体声音频。该开放权重模型使用 Creative Commons 数据进行训练,可用于学术和艺术用例。该模型利用自动编码器、基于 T5 的文本嵌入进行调节,以及基于变压器的扩散模型,使其能够产生逼真的声音和现场