来源:市场资讯

(来源:极客公园)

打开网易新闻 查看精彩图片

当大脑不再负重,技术肌肉就开始萎缩。

作者|Moonshot

编辑|靖宇

「自然语言就是新的编程语言。」这句话在过去一年里被无数人奉为圭臬。

特斯拉前 AI 总监 Andrej Karpathy 带火的 「Vibe Coding」(氛围编程)更是让这种狂热达到了顶峰——你不需要懂语法,不需要管实现,只要对着 AI 喊出需求,然后 Check 一下感觉(Vibe)对不对就行了。

听起来,程序员的门槛似乎要被抹平了。

但就在上周,大模型领域的「优等生」、Claude(也是最受欢迎的 Vibe Coding 模型之一)的母公司 Anthropic 居然自己跳出来,给这股热潮泼了一盆冰水。

图源:arxiv
打开网易新闻 查看精彩图片
图源:arxiv

他们发了一篇题为《AI 如何影响技能形成》的硬核论文,告诉我们一个残酷的真相:如果你在学习新东西时过度依赖 AI,你不仅不会变快,你的核心能力还会出现显著退化。

甚至,你可能正在变成一个「半废」的工程师。

01

人是轻松了,脑子也废了

Anthropic 的研究员这次很较真,他们找来 50 多位有经验的 Python 程序员,搞了一场「闭卷考试」。

考题是让大家去学一个从来没用过的冷门 Python 库:Trio,来完成一系列异步编程任务。这完美模拟了程序员在工作中经常遇到的场景:老板突然让你用一个你没见过的工具/框架去解决问题。

程序员被分成了两组:

「手动组」: 只能看官方文档,用 Google 搜索,严禁使用 AI。

「AI 组」: 配备了一个基于 GPT-4o 的强大 AI 助手,可以随时提问、让它写代码、修 Bug。

任务结束后,所有人都参加了一场原本用于检验「学习成果」的考试。

考试内容包括编程语法、对代码逻辑的理解、阅读代码的能力,以及调试(Debugging)能力。

大家的第一反应肯定是:AI 组肯定秒杀「土法炼钢」组吧?毕竟这可是 GPT-4o 级别的辅助。

但实验结果出来后,所有人都沉默了。

无 AI 组问答得分普遍高于 AI 辅助组|图源:Anthropic
打开网易新闻 查看精彩图片
无 AI 组问答得分普遍高于 AI 辅助组|图源:Anthropic

最明显的结果是:成绩不好。数据显示,使用了 AI 的那组人,考试得分平均比手写组低了 17%。

论文中特别提到,分差最大的领域在于调试(Debug)。

这并不意外,毕竟 Vibe Coding 最大的弊端就在于,用户不知道那堆代码是怎么跑起来的,排查和调试都无从下手。

「好吧,我承认我变菜了,但我至少变快了啊!」这可能是很多 Vibe Coding 爱好者的最后防线。

很遗憾,Anthropic 的数据再次打脸。报告显示,在完成任务的总耗时上,AI 组和手动组在统计学上没有显著差异:AI 组平均 23 分钟,手动组平均 24.7 分钟。

为什么会这样?我们不是有 AI 加持吗?论文指出了一个被忽视的时间成本:

「交互税」。

有些程序员为了让 AI 写出完美的代码,花了大量时间在「写提示词」上。数据显示,有人甚至花了 11 分钟在跟 AI 聊天,或者在一项 35 分钟的任务里,花了 30% 的时间在构思怎么问问题。

「时价比」不高,花费的时间并没有转换成得分|图源:Anthropic
打开网易新闻 查看精彩图片
「时价比」不高,花费的时间并没有转换成得分|图源:Anthropic

再结合上 Vibe Coding 最短的短板——Debug 困难。AI 组很容易陷入试错式调试(Iterative Debugging) 的循环:AI 生成代码-报错了-把报错丢给 AI:「解决一下这个 bug」-AI 再生成-又报错了……

最后整个工程变成了不可逆转的「屎山黑箱」(「屎山代码」指一种混乱、难以理解和维护的代码状态,「黑箱」则指不知道内部结构的系统)。

在这个过程中,时间一分一秒流逝,而程序员的大脑处于一种「挂机等结果」状态,既没有节省时间,也没有学到东西。

到这儿你可能对 Vibe Coding 祛魅了?别急,这篇论文最精彩的部分,在于它通过录屏分析,把使用 AI 的程序员分成了六种流派。

研究员发现,虽然 AI 组平均分低,但组内方差极大。

有的人「废」了,有的人却「超神」了。区别全在于怎么用 AI。

02

代码没编好,

用户画像倒是有了

第一类用户都可以归为「AI 废人」的低分低能组,考试得分极其惨烈,平均分都在 40% 以下(不及格)。

这一大类里还能细分为三个小类,分别是:

第二类用户就乐观多了,虽然用了 AI,但考试成绩甚至能和手写组持平(65% - 86%),寻找到了人机共生的解决方案。

拿 AI 作「辅助驾驶」的三类人得分更高|图源:Anthropic
打开网易新闻 查看精彩图片
拿 AI 作「辅助驾驶」的三类人得分更高|图源:Anthropic

这一大类里也能细分为三个小类:

为什么用的是同一个 AI,人和人的差距这么大?

或许并不是 AI 废掉了程序员,而是我们自己在「偷懒」的诱惑面前,主动选择了缴械投降。

03

Vibe Coding 的代价是

Anthropic 的这篇报告,其实触及了一个心理学概念:

认知卸载(Cognitive Offloading)。

即当工具足够强大时,我们会下意识地把原本需要大脑处理的计算、记忆、逻辑推演任务,「卸载」给工具,就像自动驾驶一样。

在 AI 时代,我们正在把「理解力」卸载给大模型。

论文里用了个比喻:AI 就像一副「外骨骼」,当你穿着它时,你力大无穷,能搬起千斤重。但问题在于,肌肉的生长需要负重和撕裂,如果你长期穿着它不脱下来,你的肌肉就会因为缺乏刺激而萎缩。

研究认为,过度依赖 AI 会直接跳过思考过程|图源:Anthropic
打开网易新闻 查看精彩图片
研究认为,过度依赖 AI 会直接跳过思考过程|图源:Anthropic

这篇论文中有一个非常不起眼、但细思极恐的数据:报错数量。

手动组在做任务时,平均每人遇到了 3 次报错。所以他们被迫停下来,盯着红色的报错信息,去查文档、去思考「为什么类型不匹配」、「为什么线程没挂起」。

而 AI 组平均每人只遇到了 1 次报错,大多数时候,AI 给出的代码不仅能跑,而且跑得极其顺滑。

AI 组的报错显著少于无 AI 组|图源:Anthropic
打开网易新闻 查看精彩图片
AI 组的报错显著少于无 AI 组|图源:Anthropic

这听起来是 AI 的优点?不,Anthropic 的研究员指出,这恰恰是问题的根源。

论文明确写道:「遭遇并独立解决错误,是技能形成的关键一环。」

手动组之所以学得好,是因为他们经历了「摩擦」。每一次报错,都是现实世界给思维的一次「阻力」。正是为了克服这种阻力,大脑被迫建立了深刻的心理表征(认知心理学术语,指当外部信息进入人脑之后,它会被我们的大脑加工,以一种特别的结构储存在大脑中)。

而 AI 组的体验就太「平滑」了。但代价是,你失去了对地面的「抓地力」:脱下外骨骼,路都不会走了。

这种「AI 过于平滑」的通病,不仅仅存在于编程中,正在蔓延到我们生活的方方面面。

在编程里,它消除了 Debug 的痛苦,让你误以为自己掌控了系统;在创作里,它消除了构思的枯燥,让你误以为自己拥有了创意;在人际关系里,它甚至也在消除「摩擦」。

就像很多 AI 成瘾的问题,都源自于 AI 永远情绪稳定,永远秒回,永远顺着你的话说,这种极致的「平滑关系」,何尝不是一种 Vibe Social。

04

「我行我上」的幻觉

Vibe Coding 最迷人也最危险的地方,在于它制造了一种「快乐但无知」 (Happy but Ignorant) 的幻觉。

论文中提到了参与者们微妙的心理变化:AI 组的参与者普遍觉得任务「更容易」,「手动组」则觉得任务很难,过程很痛苦。

但反转来得很干脆:那些觉得「容易」的人,在随后的测试中一塌糊涂;而那些觉得「困难」的人,虽然过程煎熬,但自我报告的「学习和成长感」 却更高,分数也更高。

所以Vibe Coding 让你在写代码的过程中感觉自己是个天才,直到代码报错的那一刻,你才发现自己只是个「睁眼瞎」。

在面对「未知」时,AI 是公平的,它会平等地「废掉」每一个试图偷懒的大脑,无论这个大脑曾经多么睿智。

研究人员按照编程经验将参与者分成了三层:1-3 年、4-6 年、7 年以上。

结果数据显示,在所有经验层级中,不使用 AI 的组,考试得分都高于使用 AI 的组。

哪怕是资深工程师,在 AI 辅助下得分也低于无 AI 组|图源:Anthropic
打开网易新闻 查看精彩图片
哪怕是资深工程师,在 AI 辅助下得分也低于无 AI 组|图源:Anthropic

这意味着,即使你是入行 7 年以上的老鸟,在面对一个全新的技术领域时,如果过度依赖 AI,你的学习效果依然会大打折扣。

当然了,Anthropic 的这篇论文也不是让我们因噎废食,退回到手写代码的时代。

它更像是一份「AI 时代生存指南」。想要不被 AI「废掉」,我们需要改变使用习惯,从报告中的「高分高能组」那里取经:

比如多问「为什么」,少说「帮我做」;哪怕是 AI 生成的代码,也要像审视同事的代码一样,逐行阅读,理解代码逻辑;珍视 Debug 的机会,下次遇到 Bug,试着先自己分析 5 分钟,而不是 5 秒钟后就截图发给 ChatGPT。

AI 确实能让我们跑得更快,但前提是,你得知道路在哪里,以及车坏了该怎么修。

毕竟,当自动驾驶失效的时候,只有那个还没忘记怎么握方向盘的人,才能救全车人的命。

*头图来源:Deeplearning AI Community

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你怎么看现在大部分代码

都有 AI 生成这件事?

打开网易新闻 查看精彩图片

黄仁勋:如果我现在是学生,比专业更重要的是先学 AI。

点赞关注极客公园视频号,