打开网易新闻 查看精彩图片

2024年GitHub Copilot(代码助手)用户突破1500万,Cursor(AI代码编辑器)月活增长340%。但一个反直觉的数据是:使用AI辅助编程的初创公司,技术债务平均增长47%——这恰好解释了为什么"氛围编程"(Vibe Coding)正在从内部瓦解创业公司。

「我见过这部电影。」连续创业者Alex在博客中写道。他亲历的三家创业公司里,两家死于同一种死法:不是创意不行,不是钱烧完了,是"跑得太快把东西摔碎了,然后没人知道怎么修"。

第一家:6周上线,6个月崩盘

第一家:6周上线,6个月崩盘

2022年,Alex的团队用GitHub Copilot搭建了一个SaaS(软件即服务)工具。前6周像坐火箭:两个工程师干了过去八个人的活,投资人眼睛发亮,种子轮到账。

问题藏在第7周。一个核心模块开始随机崩溃,报错信息指向一段"幽灵代码"——没人记得写过它,Git记录显示是Copilot生成的。三个工程师花了四天逆向工程,才发现这段代码处理边缘案例的逻辑和整个架构假设冲突。

更麻烦的是,这种"幽灵代码"不是孤例。到第4个月,代码库里37%的函数找不到人工编写的注释或文档。第6个月,一个关键客户的数据迁移失败,团队花了两周才发现:AI生成的迁移脚本在特定时区组合下会跳过闰秒处理。

公司死在A轮前。清算时技术审计显示:重构成本超过重新开发的80%。

第二家:速度换理解,理解换时间

第二家:速度换理解,理解换时间

2023年,Alex加入另一家AI-native(AI原生)创业公司。这次他们更激进:全员使用Cursor,目标是"用 vibe 写代码"——描述需求,让AI生成,人类只做审核。

前三个月,交付速度是行业平均的4倍。但Alex注意到一个诡异现象:工程师的"有效工作时间"在下降。不是偷懒,是大量时间花在"猜AI在想什么"上。

一个典型场景:后端工程师需要修改用户权限系统。他打开Cursor,输入自然语言描述,AI生成200行代码。表面看没问题,跑测试也过。但上线后,特定角色组合触发权限逃逸——因为AI把"或"理解成了"与"的变体,而工程师没逐行检查生成逻辑。

修复花了18小时。其中14小时花在理解AI为什么这样写,而非修复本身。

到第8个月,团队形成一条潜规则:任何AI生成超过50行的代码,必须人工重写一遍。速度优势归零,技术债务却累积到需要专门两周"还债冲刺"。

这家公司还活着,但2024年裁员40%,技术团队从"AI优先"退回"AI辅助"。

第三家:他们做对了什么

第三家:他们做对了什么

2024年,Alex作为顾问参与第三家公司。这次他坚持两条铁律:AI生成代码必须有人类"所有权人",且任何模块的复杂度必须控制在单人48小时内能完全理解。

执行起来很痛苦。工程师抱怨"AI用不爽",产品经理抱怨"速度没竞品快"。但六个月后,一个对比数据让董事会闭嘴:他们的代码变更回滚率是竞品的1/5,客户报告的"无法复现bug"数量是行业平均的1/8。

关键差异不是用不用AI,而是"谁对代码负责"。

他们的做法是:AI生成后,指定一名工程师逐行阅读、测试、签名。不是形式审查,是真正的"如果这段代码出事,我能在凌晨三点讲清楚它在干什么"。

这听起来像开倒车——从"氛围编程"退回"人工审阅"。但Alex算过账:审阅时间平均增加30%,但调试时间减少60%,整体交付周期反而缩短。

氛围编程的陷阱:认知外包的复利

氛围编程的陷阱:认知外包的复利

Andrej Karpathy(前特斯拉AI总监)今年2月提出"Vibe Coding"概念时,描述的是一种理想状态:人类描述意图,AI执行实现,双方各尽所长。

但创业公司不是理想实验室。Alex的观察是:氛围编程最大的风险不是代码质量,是"组织记忆"的流失。

传统开发中,工程师在写代码时形成对系统的 mental model(心智模型)——哪里容易出问题,什么改动会牵一发而动全身。这种直觉需要数年积累,却是快速决策的基础。

氛围编程把这个过程外包了。工程师变成"提示词工程师+代码审核员",但审核不需要深度理解,只需要表面正确。结果是:团队跑得越快,对系统的理解越浅。直到有一天,一个看似简单的需求改动,没人能预判它会引爆哪颗雷。

这解释了那个47%的技术债务增长数据。AI生成的代码不是更差,而是"更陌生"——陌生到修复成本指数级上升。

一个正在发生的分裂

一个正在发生的分裂

2024年的开发者工具市场出现两极分化。一边是Cursor、Windsurf(AI代码编辑器)们疯狂迭代,承诺"让任何人都能编程";另一边是GitHub在Copilot Enterprise版里加入"代码谱系追踪",试图回答"这段代码从哪来、谁改过、为什么这样写"。

YC(创业孵化器)2024年冬季批次的一个内部数据显示:使用AI编程工具最激进的团队,Demo Day(展示日)前平均经历2.3次"架构重启"——因为早期代码的假设被证明无法扩展,而重写比修补更快。

对比组(限制AI使用范围的团队)这个数字是0.7次。

YC合伙人Dalton Caldwell在闭门分享中说了一句被泄露的话:「我们现在问创始人的第一个问题是:你的技术债务利率是多少?不是有没有,是利率。很多团队没意识到,AI让他们借了一笔高利贷。」

Alex现在的咨询客户里,有三分之一是来"氛围编程戒毒"的——代码库已经复杂到AI自己都看不懂,需要人工先梳理出"系统到底在干什么",才能继续用AI辅助。

这像是一个讽刺的循环:用AI省下的时间,最终花在教AI理解人类之前省下的那些工作上。

如果你的团队正在用Cursor或Copilot,过去三个月里,有多少次是"AI生成的代码出了问题,但没人能三句话讲清楚问题在哪"?