OpenAI推出3款音频模型

新浪财经

2026-05-08 19:08 ·北京 ·优质财经领域创作者

来源：市场资讯

（来源：财联社AI daily）

OpenAI周四推出3款音频模型，旨在让基于语音的软件代理能够在实时对话中倾听、翻译并执行操作。其中GPT-Realtime-2旨在处理更复杂的请求、调用工具、应对中断并在更长的语音会话中保持上下文；GPT-Realtime-Translate能够输入70多种语言并翻译成13种输出语言；GPT-Realtime-Whisper支持实时语音转文字，允许在讲话过程中生成字幕、会议记录等。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴