关键功能

全双工模型,实现自然对话
通过文本提示可定制声音和角色
处理打断、倒注和对话节奏
双流配置实现低延迟交互
基于具有 70 亿参数的 Moshi 架构
在真实和合成对话的混合上进行训练
在新的场景中表现出强大的泛化能力
在关键指标上优于其他对话式人工智能代理

PersonaPlex 使用两个输入来定义对话行为:一个捕获声音特征、说话风格和韵律的声音提示,以及一个描述角色、背景信息和对话上下文的文本提示。这些输入被联合处理以创建连贯的人格。该模型基于 Moshi 架构构建,拥有 70 亿个参数,采用双流配置,允许监听和说话同时发生,从而实现自然的对话动态。


PersonaPlex 经过真实和合成对话的混合训练,包括来自 Fisher 英语语料库的 7,303 次真实对话和 39,322 次合成助手角色对话。该模型在文本提示方面表现出强大的泛化能力,即使是超出其训练分布的提示,也能在长时间的交互中保持与文本提示一致的人格。在问答助手和客户服务角色中,PersonaPlex 在对话动态、响应和打断延迟以及任务遵循度方面优于其他对话式人工智能代理。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!