近日,有人工智能领域“大佬”表示,基础模型能力已经就绪了,接下来关键是要让大模型的应用爆发,而非继续基座模型研究。此话一出,就引起了业内的不少呼应。其实大模型领域一直存在“技术派”和“市场派之争”。去年,这位大佬也提出了类似的观点,“卷模型不如卷应用”。业内另一位投资人的看法更直接:“五年后大模型公司很难独立存在,核心不在技术,而是寻找尖刀式场景。”

那么问题来了,大模型至今没有找到应用场景吗?当然不是。大模型最原生的应用:对话APP,就是一个野火燎原一样的应用场景。ChatGPT上线仅仅两个月就刷新了“最快突破1亿月活”的记录。这本身就是大模型应用广泛的最好证明。

“聊天”以外的所谓“真实场景应用”同样有很多,比如“论文辅导”。这是一个需求明确且具有相当商业价值的场景。此前,海外一些“论文辅导”公司一度形成了商业闭环,头部公司的市值甚至达到过百亿美元的水平。但ChatGPT上线之后,用户们很快就发现,与真人老师的服务相比,AI老师的服务响应速度更快、质量也更高。相关公司的市值一路暴跌,如今只剩其最高点的5%。

然而,这似乎依然远不足以打消怀疑派的顾虑。社会和资本对大模型的期待远远不局限于和人聊天或是帮学生写作业。乐观派们一直将大模型放到了和计算机、互联网和智能手机相同的位置上。这意味着我们将看到好几个万亿美元的公司和无数个千亿、百亿美元级别的公司成长起来。按照这样的期待,大模型的应用程度的确还远远不够。

但问题在于,人工智能的技术发展路径到底应该是怎样的?大模型和互联网、计算机这些之前的颠覆性技术存在巨大的差异。它无法像此前任何一个商业产品一样不断“小步迭代”,慢慢试错。只有把模型参数堆叠到“巨大”的规模,智能才能“涌现”出来,进而产生质变。而在抵达智能涌现的“临界点”前,需要在硬件、人才等方面做出惊人的投入。

这也让人工智能研究成为了学术界和企业界差异最大的学科之一。对社会或私有资本来说,追求回报率才是最重要的目标。无论目标再怎么宏大,连续多年数百亿美元的持续支出也难以持久。或许,这才是最近“研究派”和“应用派”论战持续升温的根本原因。

何况,缺乏应用,真的只是所有人都“过于关注底层基座模型的研发”了吗?实际情况也并非如此。即使是一直投入巨量资金做基础研究的OpenAI,也会开发出类似GPTs这样的平台,让广大商业用户可以上传自己的数据,设计自己的指令,根据自己感兴趣的场景定制模型性能,开展更精准的应用开发。实际上,2024年开始,国内几乎所有大模型平台也都跟进了这一趋势。一时间个人开发的智能体满天飞舞——当然,其中大部分只是各种类型“可甜可咸”的聊天机器人,但生成式人工智能的发展才刚刚开始,假以时日,很难说其中会生长出何种有用、有趣、有场景、有价值的应用型产品来。

当我们站在这样的期待的角度,再来回看现有的基座大模型,很容易就会发现,它们显然还不够好。大模型在非常专业的领域仍然无法做到稳定地提供让人倚赖的答案。另外,大模型的本质缺陷之一在于对物理世界缺乏理解。特别是在文字之外的其他模态,生成效果难以让人满意。和更接近第一性原理的计算机图形学相比,大模型技术从大量图片或视频中学到统计规律,然后拟合出新的结果。因此虽然方便,但经常产生违背常识,乃至“鬼畜”的图片和视频。

也许到了这一步,我们才能更清晰地看到生成式人工智能的未来发展之路。也才能更理性地看待“卷模型”和“卷应用”这两者之间的关系。从某种意义上说,这两个选项并没有本质上的冲突。如何快速走出基座大模型研究的低迷状态,优化现有模型水平,并以此为基础开发出更多优秀的产品,为国计民生和社会公众,提供更好的服务——这才是人工智能产业发展的应有之义。

作者 | 南芥 原麻省理工科技评论中文版编辑