打开网易新闻 查看精彩图片

(图片来源:unsplash)

刚刚,OpenAI再公布新消息。

钛媒体App 5月20日消息,OpenAI公司发布推文,宣布将暂停供聊天机器人ChatGPT语音功能使用的“Sky” 语音,起因是用户指出该声音与美国知名女演员、女歌手斯嘉丽·约翰逊 (Scarlett Johansson) 的声音十分相似。

OpenAI澄清表示,这是用超过400名配音演员声音采集、筛选和数据训练的,而非斯嘉丽·约翰逊的声音。

OpenAI透露,未来几周内,GPT-4o为ChatGPT Plus付费用户提供新的语音模式,名为Alpha版本。借助GPT-4o,使用语音与 ChatGPT交互更加自然,可有效管理群组对话、过滤背景噪音等。

“展望未来,您可以期待更多选择,因为我们计划在 ChatGPT 中引入更多声音,以更好地满足用户的不同兴趣和偏好。”OpenAI表示。

打开网易新闻 查看精彩图片

据悉,5月14日,OpenAI推出可免费使用、可实时进行音频、视觉和文本推理、短至232毫秒响应音频输入的全新旗舰AI模型GPT-4o,并将推出PC桌面版ChatGPT。

OpenAI CTO米拉·穆拉蒂 (Mira Murati)表示,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。

OpenAI CEO奥尔特曼称,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。“这对我们的使命很重要,我们希望将出色的 AI 工具交到每个人手中。”

实际上,早在2023年9月,OpenAI引入了语音功能,为用户提供另一种与 ChatGPT 交互的方式。

OpenAI表示,语音模式是ChatGPT中最受欢迎的功能之一。用户听到的五种不同声音中的每一种都是经过为期五个月的广泛过程精心挑选的,涉及专业配音演员、人才机构、选角导演和行业顾问。

“这些都是从我们合作创作的配音演员中采样而来。”自去年初开始,OpenAI对用户对该功能和个人声音的反应方式进行测试,声音包括Breeze、Cove、Ember、Juniper 和 Sky,

2023年5月,选角机构和OpenAI选角总监发出了人才招募。在不到一周的时间里,团队收到了400多份配音和演员提交的作品。在试镜时,演员们收到了一份包含ChatGPT 回复的脚本,并被要求将其录制下来。这些样本的范围从回答有关正念的问题到集思广益的旅行计划,甚至参与有关用户一天的对话。

随后,选角团队独立审查并手工挑选了14名演员的初步名单。而OpenAI则最终选择了五个声音,并与演员讨论了我们对人机交互的愿景以及语音模式的目标。

2023年6月、7月,OpenAI让演员们飞到旧金山进行录制,并与 OpenAI 产品和研究团队进行面对面的会议。

2023 年9月25日,OpenAI将他们的声音发布到 ChatGPT。

OpenAI指出,ChatGPT采取的声音特征主要包括五个点:来自不同背景或会说多种语言的演员;感觉永恒的声音;平易近人的声音激发信任;温暖、迷人、鼓舞人心、富有魅力的声音和丰富的音调;自然易听。

OpenAI强调,公司与配音行业密切合作,以确保采取正确的步骤来为 ChatGPT 配音。每个演员都会获得高于市场最高水平的报酬,只要他们的声音在产品中使用,这种情况就会持续下去。

“我们认为AI声音不应该刻意模仿名人独特的声音——Sky的声音不是模仿斯嘉丽·约翰逊,而是属于不同专业女演员使用她自己自然说话的声音。为了保护他们的隐私,我们不能透露我们配音员的名字。”OpenAI称。

OpenAI强调,整个过程涉及演员和选角团队的广泛协调,历时五个多月。公司将继续与参与者合作,他们为 GPT-4o 中的音频研究和新语音功能做出了额外的工作。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)