dots.tts 是一个 20 亿参数、完全连续、端到端的自回归文本转语音系统。其骨干结合了语义编码器、LLM 和一个作用于 48 kHz AudioVAE 之上的自回归流匹配声学头，整个流程不使用离散 token。
项目页面强调它在中文、英文、困难中文评测、多语言说话人相似度、语音克隆和情感表达等方面取得了强基准结果。页面还提供了单语、跨语种以及上下文感知

dots.tts | 寻找最新最热门的文本转语音AI | 浏览最全面的AI数据库

dots.tts 是一个 20 亿参数、完全连续、端到端的自回归文本转语音系统。其骨干结合了语义编码器、LLM 和一个作用于 48 kHz AudioVAE 之上的自回归流匹配声学头，整个流程不使用离散 token。 
项目页面强调它在中文、英文、困难中文评测、多语言说话人相似度、语音克隆和情感表达等方面取得了强基准结果。页面还提供了单语、跨语种以及上下文感知表达式语音克隆的音频示例。 
dots.tts 适合希望获得开源高质量 TTS、语音克隆和多语言能力的语音 AI 研究者与开发者。公开的 GitHub、Hugging Face 集合和演示空间链接使其便于查看模型资源并试用示例。

dots.tts

关键功能

Subscribe to the AI Search Newsletter