打开网易新闻 查看精彩图片

OpenAI 似乎正在将实时语音能力接入 Codex。

Developing Adventures 发现,Codex CLI 最近的提交中出现了与 realtime voice mode 相关的代码和配置,指向一种新的交互方式,用户直接对 Codex 说话,模型用语音回应,同时后台 agent 继续完成代码修改、运行命令和推进任务。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

从 OpenAI 官方 GitHub 仓库看,这并非空穴来风。

Codex 近期提交中已出现 “realtime voice selection”“Realtime V2 background agent progress”“background_agent”等字样;代码里也能看到 /realtime 命令,描述为“切换实验性实时语音模式”。

Codex 的交互形态可能正从“文本输入 + 终端执行”进一步走向“语音对话 + 后台编码 agent”。

不过,这项能力目前仍处于实验阶段。

GitHub issue 中已有用户反馈,开启 voice transcription / realtime voice 后,使用量可能异常快速消耗;也有人报告 /realtime 命令曾返回 404 错误。因此,这更像是 OpenAI 正在内部迭代和灰度测试的功能,而不是已经面向所有用户稳定开放的正式版本。

云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片