该模型将 GPT-5 级推理添加到实时语音交互中,并为开发人员提供了对推理工作、语气、交付、前导码和工具透明度的控制。它支持具有更大上下文窗口的更长代理会话,并且可以并行调用多个工具,同时让用户了解自然的语音状态更新。这使得它更适合必须处理更正、领域术语、专有名词和多步骤任务而不会丢失对话上下文的生产语音代理。
对于开发人员来说,GPT Realtime 2 可通过 OpenAI 的 Realtime API 作为低延迟音频应用程序的付费模型使用。它可以与 GPT Realtime Translate 和 GPT Realtime Whisper 结合使用,构建涵盖实时推理、多语言翻译和流式转录的完整语音系统。当语音助手需要将自然音频交互与工具执行、安全护栏、长上下文和可控响应行为相结合时,该产品最为强大。

