对于需要即时性的应用,Scribe v2 实时版提供低于 150 毫秒的延迟,使其成为客户服务环境、虚拟会议或为动态对话代理提供支持等实时转录需求的基准。这种实时能力由“流式优先”架构支持,确保了与需要对 90 多种语言的实时语音进行即时理解的产品实现无缝集成。此外,系统智能地处理语音活动检测,精确地分割语音边界,以实现更流畅的实时处理。
除了实时转换,标准 Scribe v2 在处理预录制的音频和视频文件方面表现出色,使用户能够轻松地为播客或教学视频等内容生成字幕、片尾字幕和完全可编辑的文字记录。此版本还集成了高级功能,例如 Keyterm Prompting(用于指导特定词汇的转录准确性)、Dynamic Audio Tagging(用于标记笑声等非语音事件)以及强大的 Speaker & Entity Detection(用于区分参与者并有效记录时间戳)。内容创作者和企业都能受益于嵌入在转录输出中的丰富上下文数据。

