来源:市场资讯
(来源:麻省理工科技评论APP)
今年 2 月,我在伦敦一场反 AI 游行上拿到了一张传单。我不确定写这张传单的人是不是在致敬《南方公园》里的“内裤精灵”,但如果是的话,他们模仿得非常到位。传单上写着:“第一步:培育一个数字超级大脑。第二步:?第三步:?”
《南方公园》的“精灵”那集于 1998 年首播。肯尼、凯尔、卡特曼和斯坦发现一群小精灵每晚偷偷溜出来从衣柜里偷内裤。为什么?精灵们展示了自己的商业计划书:“第一阶段:收集内裤。第二阶段:?第三阶段:盈利。”
这套精灵商业计划后来成了互联网上最经典的梗之一,用来讽刺那些愿景宏大但中间路径完全空白的计划。马斯克也曾在一次演讲中引用它,解释他打算怎么为火星任务筹钱。眼下,它精准地捕捉了 AI 行业的现状:公司造出了技术(第一步),许诺了变革(第三步)。至于怎么从第一步走到第三步,仍然是一个大大的问号。
这张传单出自 Pause AI,一个参与组织了这次抗议活动的国际激进组织。传单的结尾向读者发出呼吁:“在我们搞清楚第二步到底是什么之前,暂停 AI。”
在 Pause AI 看来,第二步必须包含某种形式的监管。但具体要监管什么、由谁来执行,还远没有定论。
AI 的拥趸们则坚信第三步是救赎,倾向于对中间那一段含糊带过。他们认为我们正骑着一项“具有经济变革性的技术”奔向光明的未来——这是 OpenAI 首席科学家雅库布·帕乔基(Jakub Pachocki)几周前对我说的话。他们知道自己要去哪里,或者说是大概知道;但山顶上雾蒙蒙的,而且还有一段距离。但每个人走的路不一样。他们都能到达吗?有人能到达吗?
每一个关于未来的宏大宣言背后,都有一个更冷静的现实评估在给热度降温。看看最近两项研究就知道了:一项来自 Anthropic,预测了哪些类型的工作最容易受到 LLM 的影响(Anthropic 认为,经理、建筑师和媒体从业者应该做好准备迎接变化;园林工人、建筑工人和酒店从业者暂时不用太担心)。但这些预测说到底只是猜测,依据的是 LLM 看起来擅长什么类型的任务,而不是它们在实际工作场景中的真实表现。
另一项研究于 2 月由 AI 招聘初创公司 Mercor 的研究人员发布。他们用 OpenAI、Anthropic 和 Google DeepMind 的顶级模型驱动了几个 AI 智能体,让它们完成 480 项银行家、咨询师和律师日常工作中常见的任务。结果是:每一个智能体都未能完成大部分工作。
为什么各方说法差这么远?原因有两个:
第一,要看是谁在说这些话。Anthropic 本身就是一家 AI 公司,它预测 AI 影响力越大,对自己的生意越有利。第二,大多数喊着“大事要来了”的人,依据主要是 AI 编程工具进步得有多快,但写代码只是职场任务中的一小部分。需要做战略判断、权衡利弊的工作,LLM 目前还做得很差。
更重要的是,这些工具在部署时不是被放进一间无菌室,它们要在有人、有既定工作流程的混乱环境中运转,有时候加入 AI 反而会让事情变得更糟。当然,也许这些工作流程确实需要被推倒重来,围绕新技术重新设计,这项技术才能真正达到变革性的地位。但那需要时间,也需要胆量。
那个巨大的空白?它正好在第二步应该在的位置。对于究竟要发生什么、怎么发生,业界缺乏共识,由此产生的信息真空就被每周最新的疯狂宣言所填充,证据靠边站。我们对于即将到来的东西以及它将如何落地,已经失去了任何扎实的理解根基,以至于一条社交媒体帖子就能(而且确实在)撼动市场。
我们需要的是更少的猜测、更多的证据。但这需要模型开发者的透明度,需要研究人员与企业之间的协调,也需要新的评估方法来告诉我们:这项技术在真实世界中部署后,到底发生了什么。
整个科技行业(连带全球经济)都建立在一个悬而未决的承诺上:AI 真的会具有变革性,但这目前还不是板上钉钉的事。下次你听到关于未来的大胆宣言时,记住:大多数企业还像“内裤精灵”一样,卡在第二步。
https://www.technologyreview.com/2026/04/27/1136456/the-missing-step-between-hype-and-profit/
热门跟贴