打开网易新闻 查看精彩图片

出品 | 搜狐科技

作者 | 郑松毅

运营编辑 | 王一晴

“GPT-4o并不是突然解锁的一项疯狂的新技术,而是功能累积和整合的结果。”——OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)。

近日,在OpenAI发布又一重磅AI模型——GPT-4o后,奥特曼接受了硅谷著名风险投资公司Redpoint董事兼总经理Logan Bartlett的采访。在45分钟的对话中,奥特曼谈了谈对GPT-4o、GPT5、以及未来人工智能世界的看法。

GPT-4o登场后,其高效处理文本、图像、音频等多模态的能力,以及为用户提供的更为自然、流畅的交互体验,再次让人类感到震撼和好奇,如此强悍的AI模型究竟是如何塑造的?

奥特曼表示,“在过去几年,OpenAI团队一直在研究音频模型、视觉模型,以及如何将它们结合起来,同时也在努力提高模型的训练效率。我们这次并不是突然解锁了一项从来没有的技术,而是将很多功能部分整合在了一起。

他说,很久之前自己和团队成员就有了语音控制计算机的想法,比如Siri之类的东西,但从没真正让人感到自然好用。而GPT-4o完全不同,它是一种令人难以置信的人机交互方式,比如更快地理解和处理多模态信息、语调更加自然、以及拥有高度流畅性和灵活性,这是令人着迷的地方。

“虽然我只用了一周左右,但让我惊喜的一个用例是我在全神贯注工作的时候,我可以把手机放在桌子上,不用来回切换窗口,而是直接把GPT-4o当作另一个信息通道。比如说,我正在处理某件事,以前我可能不得不停下来,切换到另一个网络页面去搜索一些东西。但是现在,我只需要向它提问,就可以立即获得答案,我可以专注于电脑屏幕上的内容,这真的很酷。”

很多人将GPT-4o看作是GPT-5重磅发布的预告,并一直对GPT-5的发布时间及功能升级保持高度期待。

奥特曼坦言,人工智能和惊喜并不总是搭配着来的,未来可能不会有大规模的发布。也许我们仍然可以把它命名为GPT-5,但以不同的方式发布,或者换个名字。就目前来说,GPT-4还在不断改进中。

自AI模型开“卷”以来,垂直大模型和通用大模型一直是备受热议的技术路径分水岭。垂直大模型更像一把专用工具,专注于特定领域或任务。而通用大模型更像是一把多功能瑞士军刀,应对于多种不同的任务和场景。相较之下,奥特曼更看好哪种模型的发展呢?

他直言,“通用模型更为重要,当模型具备泛化推理能力时,能够自己弄清楚新的东西,那么当它需要处理新类型的数据,你只要输入进去,它就能懂了。但反过来就不太行,比如把一堆专业化的垂类模型放在一起,我觉得做不到通用推理。”

对于AGI(通用人工智能)的实现,奥特曼最初相信会有一个明确的时刻。但现在,他多次在访谈中强调,AGI的实现是一个渐进的过程,对于何时能实现尚未达成共识,它不是GPT-4,也可能不会是GPT-5,距离AGI的实现还需要一些更大规模的突破。

他曾表示,已经放弃了对实现AGI时间的预测,觉得这不是真正有用的。在他看来,每年都会推出更强大的系统,怎样用这些系统为社会创造更多的价值才是值得思考的。

谈及AI给世界带来的变革影响,奥特曼认为,目前为止,ChatGPT本身还没有改变世界,而是改变了人们对世界的期望。

“从现在的GDP等经济数据中还找不到GPT真正影响生产力的证据,但我认为,如果几十年后再去分析相应的经济图标走势,肯定能察觉到背后的变革。”奥特曼预测,在未来12个月内,编程会是受其影响的一个重要领域。

他还谈到,人们以前常会担心有了AI后什么样的工作会消失,但什么样的新工作会出现是一个更有趣的问题。奥特曼认为,类似于艺术、娱乐这样的业态很有发展潜力,但相信人与人之间的联系并不会被AI取代,反而会被注重。

“我在网上读到一些东西,很多人都在说会和ChatGPT谈恋爱,我打赌不会。长期关心其他人类是我们的本性,无论以任何方式,我们将一直痴迷于此。”

最后,奥特曼被问及,AGI一直被大家所谈,但如畅想下AGI得以实现的未来会是什么样子,会不会太抽象难以回答?

奥特曼笑了笑说,“我一直都在想,但不会只想象我们会拥有《星球大战》未来城市中满天飞行的汽车。我想的是,当一个人可以作为一个团队,去完成成百上千人配合协作才能完成的任务时,将意味着什么?又或是有一天能破解出所有科学奥秘,那世界又会变成什么样子?这是我一直思考且感到兴奋的。”

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片