打开网易新闻 查看精彩图片

ChatGPT的高级语音模式已可让用户与聊天机器人实时交谈,而据最新测试版代码显示,ChatGPT可能很快还会拥有视力。尽管OpenAI尚未明确新功能的具体发布情况,但Android Authority在ChatGPT v1.2024.317测试版中发现的代码表明,传说中的“实时摄像头”功能或许即将上线。

OpenAI于5月首次展示了ChatGPT的高级语音模式的视觉功能,当时该功能首次在alpha版本中推出。在当时发布的演示中,系统能够通过手机的摄像头信息识别出它正在看狗,根据过去的互动识别狗,识别狗的球,并将狗与球的关系联系起来(即玩接球游戏)。

高级语音模式随后于 9 月向 Plus 和 Enterprise 订阅者发布测试版,尽管没有额外的视觉功能。当然,这并没有阻止用户疯狂地测试该功能中的语音功能。据该公司称,Advanced Voice “提供更自然、更实时的对话,让您随时打断,并感知和回应您的情绪”。

数字眼睛的添加肯定会使 Advanced Voice Mode 与 OpenAI 的主要竞争对手 Google 和 Meta 区分开来,这两家公司最近几个月都推出了自己的对话功能。

Gemini Live 可能能够说 40 多种语言,但它无法看到周围的世界(至少在 Project Astra 启动之前)——Meta 的自然语音交互也不能使用摄像头输入,该功能在 9 月的 Connect 2024 活动中首次亮相。

OpenAI 今天还宣布,高级语音模式现在也可用于桌面上的付费 ChatGPT Plus 帐户。它曾经只在移动设备上使用过一段时间,但现在也可以直接在笔记本电脑或 PC 上访问。