关键功能

启用实时语音代理,在实时对话期间进行监听、推理、响应和采取行动。
支持针对更难的口头请求和多步骤任务流的 GPT-5 级推理。
提供可调整的推理工作水平以平衡延迟和深思熟虑。
允许以语音透明方式进行并行工具调用,以便用户知道代理正在做什么。
扩展了上下文支持,以实现更长、更连贯的代理语音会话。
改进中断、修正和失败刀具路径的恢复行为。
更可靠地处理专业术语、专有名词和特定领域词汇。
与 OpenAI 的实时 API 集成,用于生产语音产品。

该模型将 GPT-5 级推理添加到实时语音交互中,并为开发人员提供了对推理工作、语气、交付、前导码和工具透明度的控制。它支持具有更大上下文窗口的更长代理会话,并且可以并行调用多个工具,同时让用户了解自然的语音状态更新。这使得它更适合必须处理更正、领域术语、专有名词和多步骤任务而不会丢失对话上下文的生产语音代理。


对于开发人员来说,GPT Realtime 2 可通过 OpenAI 的 Realtime API 作为低延迟音频应用程序的付费模型使用。它可以与 GPT Realtime Translate 和 GPT Realtime Whisper 结合使用,构建涵盖实时推理、多语言翻译和流式转录的完整语音系统。当语音助手需要将自然音频交互与工具执行、安全护栏、长上下文和可控响应行为相结合时,该产品最为强大。

在您的网站添加此徽章,以获得更多点赞并登上搜索结果顶部!

嵌入按钮预览 - 浅色主题
嵌入按钮预览 - 深色主题

Subscribe to the AI Search Newsletter

Get top updates in AI to your inbox every weekend. It's free!