打开网易新闻 查看精彩图片

作者| 高凌朗

编辑| 汪戈伐

在5月14日的凌晨,Open AI举办了春季发布会。与以往相比,这次活动更加简短,整体时长未超过26分钟。此外,发布会没有涉及技术或算力等专业术语的介绍,且OpenAI创始人Sam Altman也并未出席。

尽管如此,发布会仍然给整个AI行业带来了不小的震撼。OpenAI的首席技术官Mira Murati向全世界展示了ChatGPT的最新产品——ChatGPT-4o。这款产品能够“听见”人类、“看见”人类、“感受”人类,并与现实世界进行交互,它是一个越来越接近人类的AI私人助理。
在发布会上,两位OpenAI的研究员通过手机端和电脑端,针对不同使用场景展示了ChatGPT-4o的最新功能。这些功能包括对话的实时回复、随时打断的对话能力,以及多样化的对话语音。OpenAI创始人Sam Altman称之为“人类级别的响应”。
此外,利用摄像头,ChatGPT能够识别并解答课本上的数学题目,并通过对话逐步指导解题过程。通过屏幕抓取,ChatGPT能够阅读并分析电脑的编程代码或表格、图像内容,并提供详细的解读和分析。总体而言,ChatGPT-4o让AI大模型的实用性更进一步。
关键的是,Mira Murati宣布ChatGPT-4o免费向所有人开放,客户端将上线Mac OS、IOS商店,并在晚些时候上线Windows平台,不过免费用户每日限制条数,而付费用户能享受高达5倍的消息容量。
比尔·盖茨曾在AI Forward 2023活动上谈论AI,并称:“你永远不会去搜索网站了,也不会再去亚马逊了”,这说明当时人们还在担心自己会不会被AI“干掉”。现在,拥抱AI是科技企业的必由之路。
智能设备和软硬件厂商正在纷纷站队AI“流派”,其中苹果的战略倾斜尤为引人注目。GPT-4o形态近乎刻画出人们理想中的“Siri”。OpenAI正在推动其先进模型的免费开放,并致力于将这些技术落地到端侧设备。
总总迹象表明,关于AI的应用场景,今年或许该揭秘了。

打开网易新闻 查看精彩图片

GPT-4o是GPT-4的迭代版本,据OpenAI官网介绍,GPT-4o中的o代表omni(译为全能)。它能够快速响应语音对话,GPT-4o的平均响应时间与人类反应速度几乎一致,根据直播演示,其平均响应速度320毫秒,比以往缩短了至少十倍。
GPT-4o被OpenAI首席技术官Muri Murati宣布为“最好的模型”,并向所有用户免费开放。在文本、推理、编码智能方面,GPT-4o达到了GPT-4 Turbo级别的性能,并在多语言、音频和视觉功能上实现了新水平。
通过情绪级别的对话分析能力,GPT-4o对人类情感、语言逻辑的理解更加深刻。发布会中,GPT-4o的对话不再像传统语音助手那样刻意咬文嚼字,用户也不会有意识地感觉自己是在与一台机器对话。
GPT-4o具备实时翻译能力,能够在不同语言之间进行流畅转换。这得益于它相比之前的模型更加自然,具有更高的“情商”,极少出现对语音的误判。不少网友表示别的功能不说,锻炼口语的效果就已经是天花板了。
另外,GPT-4o具有原生多模态能力。具体来说,可以将文字、声音、图像、视频多种信息类型组合输入,并产生联系,经过模型处理的内容也能通同样的组合反馈给用户。
直播演示的所有交互,都是端到端的。据首席技术官Mira Murat表示,这也是他们第一次在易用性上作出改进。而且GPT-4o不仅将直接提供给用户使用,还将其作为API开放给开发者。
目前公布信息中,所有ChatGPT用户均可免费使用GPT-4o,但有使用次数限制。我们不难看出,Open AI需要更多的、不同的用户去使用它,以便模型的“成长”。

打开网易新闻 查看精彩图片

由于OpenAI在AI行业的技术领先优势明显,它在行业中自然被视为发展的风向标。然而,发布会结束后,许多AI行业从业者表达了他们的失望,因为他们既没有看到GPT-5的亮相,也没有目睹任何可能改变世界的突破性创新。
对此,Sam Altman发文解释说:我们使命的关键是将强大的AI工具免费(或实惠)提供给大家。我自豪 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。”
当然,这也使得外界对其商业模式产生了质疑,是不是用户注册五个免费账号,就获得订阅Plus一样的体验了?
事实上,尽管GPT-4o的免费政策似乎对OpenAI的商业模型构成挑战,但考虑到ChatGPT Plus的订阅收入与OpenAI的千亿估值相比,个人用户的充值对公司的整体财务状况影响相对较小,根据第三方AppStore检测网站数据,ChatGPT全球Apple商店订阅收入为1200万美元。
虽然没有等到GPT-5,但外界认为OpenAI在这个时间点放出GPT-4o也是有理由的。
首先,谷歌的2024年I/O开发者大会将在第二天举行,OpenAI的发布会很难说不是在针对谷歌;其次,苹果的WWDC将在6月10日举办,考虑到苹果拥有20亿活跃设备的用户基础,其在人工智能领域的决策可能会成为行业发展的一个重要转折点。
5月11日,彭博社曝出猛料:苹果马上要跟OpenAI签署协议,将ChatGPT相关技术用在iPhone里。《纽约时报》也曝出:苹果Siri即将发布的一系列重磅生成式AI升级、背后研发细节,以及苹果顶层高管做出要给Siri做“大脑移植”这一决定的幕后原因。
对照发布会中,OpenAI研究员全程使用iPhone和MacBook Pro进行演示,这可能表明OpenAI与苹果有合作的意向。另外,Mac端ChatGPT也将优先于Windows端发布。
回想今年2月,谷歌AI推出了Gemni1.5,与GPT-4相比,可处理超过100万个token的输入窗口;随后,ChatGPT推出了文生视频模型Sora,它比以往任何同类型模型更了解物理世界。
如今,OpenAI赶在谷歌前一天发布了重磅升级,我们不难认为,AI科技界的“军备竞赛”正在发生。

关注下方备用账号

防止失联