来源 | 美股投资网

OpenAI将于5月13日周一举办发布全新的产品。但却对到底要发布什么闪烁其词。此前网友猜测的GPT-5或者AI搜索引擎都被否定。

CEO奥特曼发推表示:

不是GPT-5,也不是搜索引擎,但我们一直在努力开发一些大家会喜欢的新东西!对我来说,它就像魔法一样。

这个神秘的新产品到底是什么?媒体援引两位知情人士说法称,新产品是一个具备视觉和听觉功能的AI模型,且具有比目前的聊天机器人更好的逻辑推理能力。

01 一个有视觉和听觉的全新多模态AI

报道称,OpenAI最快可能会在下周一公开展示新产品,以抢在下周谷歌的一系列产品发布之前。

奥特曼希望最终开发出一种类似电影《她》中的AI助手那样能够快速响应的人工智能,并以这种技术支持苹果Siri等现有语音助手。

根据美股投资网的知情人士透露,苹果已经与OpenAI达成协议,将在iOS 18中使用后者的技术,强化Siri的功能。

这意味着什么?

截止2024年,全球共22亿台苹果ISO设备,如果都加入ChatGPT,意味着OpenAI的算力一定支撑不住,OpenAI被迫继续买入几十万个英伟达的GPU去支撑22亿人使用ChatGPT。

作者称,英伟达是其一直长期持股的唯一公司,成本500美元。

打开网易新闻 查看精彩图片

苹果苹果公司软件工程高级副总裁Craig Federighi和分管人工智能业务的副总裁John Giannandrea去年曾花费数周时间测试ChatGPT,随后意识到相比领先的生成式人工智能技术,Siri“看起来已经过时了”。

据一位曾在Siri团队工作过的工程师对媒体表示,Siri团队未能获得苹果内部其他团队所获得的关注和资源,公司的软件和硬件等部门独立运作,共享的信息有限。但人工智能产品要想取得成功,就必须与产品深度融合。

打开网易新闻 查看精彩图片

2011年推出的Siri还未曾有过重大迭代,她不支持多轮对话,也经常无法理解用户的请求。甚至连基本的点歌都经常出错,这也削弱了苹果智能音箱HomePod的吸引力。

不过,在测试过ChatGPT之后,苹果就进行了“十多年来规模最大的重组”,将资源集中于AI方向。今年年初取消苹果汽车项目后,大部分工程师都转岗到了AI团队。据报道,苹果用于迭代Siri的研发经费高达每天数百万美元。

苹果高层认为,ChatGPT等聊天机器人背后的大语言模型技术可以增强Siri的能力。苹果已经与OpenAI已经达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。苹果也在和谷歌进行谈判,可能也会引入其LLM,不过协议尚未敲定。

02 新Siri将通过边缘计算技术运行 成本更低速度更快

iPhone目前占据全球智能手机利润的85%,销售额超过2000亿美元,令无数消费电子硬件生产商艳羡,也吸引了众多挑战者。

包括Humane Ai Pin、Rabbit R1等全新AI硬件,都宣称拥有挑战iPhone的潜力。虽然这些设备眼下对iPhone不具备什么威胁,不过苹果内部担心,随着大模型技术的发展、其他智能手机制造商将更多AI元素融入其操作系统,让iPhone显得像“一块笨砖头”。尤其是可以自动完成制定旅行计划、打车、订餐等复杂任务的被称为“代理”(agents)的AI技术,其智能和便捷性,可以让苹果AppStore里的许多软件黯然失色。

目前来看,苹果不打算直接发布全新的聊天机器人与ChatGPT、Claude等竞争。据媒体报道,苹果专注于让Siri更好地处理用户请求,包括设置定时器、创建日历事件和向杂货清单添加物品等,全新的Siri或许还可以总结短信内容,一键创建GIF图片等等。

此外,苹果的技术路径与其他聊天机器人有一点非常重要的不同——新版Siri将基于边缘计算技术而非云计算,即无需联网就能理解上下文、完成对话,响应速度更快,也不需要昂贵的数据中心成本。

也因此,苹果将升级今年iPhone的内存,以支持全新的边缘人工智能计算。

OpenAI已经有了可以转录音频和将文本转换成语音的软件,但这些功能是通过单独的AI聊天机器人实现的,而新产品则将这些功能整合在了一起,而且能够更好地理解图像和音频,响应速度也更快。

OpenAI认为,具有视觉和听觉功能的助手有可能像智能手机一样带来变革。它可以观察用户所处的环境信息,提供建议,潜在的用例如充当家庭教师、翻译标志、修理汽车等等。

03 新模型暂时无法在个人设备上运行 最终会免费开放给所有用户

由于新模型较为复杂,参数量级高,个人设备的配置暂时无法满足其性能需要。

媒体分析指出,新模型运行依赖云端,需要互联网连接才能工作。要使具有视觉和听觉功能的复杂人工智能对话变得足够小巧,以便在手机等个人设备上运行,可能需要几个月甚至几年的时间。

目前也没有消息透露OpenAI何时会向付费用户提供这些功能。不过根据一些企业的预览来看,OpenAI的新模型可以改进其服务中已有的功能,如自动客户服务代理。一位知情人士对媒体表示,新软件的音频功能可以帮助客服人员更好地理解来电者的语音语调。

此外,媒体还称,OpenAI希望新模型最终能免费开放给所有用户使用,因此需要让其运行成本低于目前的最强大模型GPT-4 Turbo。