OpenAI推出3款音频模型
新浪财经
·北京
·优质财经领域创作者
来源:市场资讯
(来源:财联社AI daily)
打开网易新闻 查看精彩图片
OpenAI周四推出3款音频模型,旨在让基于语音的软件代理能够在实时对话中倾听、翻译并执行操作。其中GPT-Realtime-2旨在处理更复杂的请求、调用工具、应对中断并在更长的语音会话中保持上下文;GPT-Realtime-Translate能够输入70多种语言并翻译成13种输出语言;GPT-Realtime-Whisper支持实时语音转文字,允许在讲话过程中生成字幕、会议记录等。
热门跟贴