关键功能

高质量的快速文本到语音声音克隆
在单个 GPU 上可达到实时速度的 150 倍
清晰的 48kHz 语音生成
支持声音克隆
高效且轻量
可在 1GB VRAM 内运行
易于使用和集成
支持简单的推理和采样参数

LuxTTS 有几个关键特性使其在其他文本到语音模型中脱颖而出。它提供清晰的 48kHz 语音生成,与大多数仅限于 24kHz 的模型不同。该模型还支持声音克隆,允许用户复制参考音频文件的声音。此外,LuxTTS 非常高效,在单个 GPU 上可达到实时速度的 150 倍,在 CPU 上则快于实时速度。这使其适用于实时应用和大规模部署。


该模型易于使用和集成到现有应用中。它可以加载到 GPU、CPU 或 Mac 的 MPS 上,使其具有多功能性并能适应不同的硬件配置。LuxTTS 还支持简单的推理和采样参数,允许用户针对特定用例微调模型。该模型根据 Apache-2.0 许可证授权,是开源的,可免费使用和修改。这使其成为寻求高质量文本到语音模型的开发人员和研究人员的有吸引力的选择。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!