GitClear扒了2.1亿行代码：AI编程让重构率跌破10%

Ping值焦虑

2026-03-31 11:08 ·北京

周五晚上8点，P0告警弹进频道。核心模块在生产环境静默崩溃。

你打开仓库，定位文件，盯着500行格式完美、语法无误的代码。问题是——你完全不知道它在干什么。逻辑像迷宫。三周前合并这段代码的同事？他也不懂，因为是Claude（Anthropic开发的AI助手）写的，聊天记录早没了。

DORA指标（研发效能评估体系）漂亮得不像话，但说实话，你们对代码库的理解从未如此稀薄。

这就是理解债务（Comprehension Debt）的时代。Google工程师Addy Osmani创造了这个词。技术债务是你知道很烂的代码；理解债务是你连自己不懂都不知道的代码。

速度幻觉：19%的减速被感知为20%的加速

速度幻觉：19%的减速被感知为20%的加速

AI编程工具确实神奇，但它们像一台雾机。代码喷涌而出，人类工程师根本来不及在脑子里绘制系统地图。

一项研究发现了诡异的感知鸿沟：使用AI的开发者处理复杂任务时实际慢了19%，却感觉自己快了20%。工具篡改了我们的内置测速仪。

这种错位正在制造隐蔽的代价。你以为在飙车，其实在雾里逆行。

GitClear分析了2.11亿行代码，发现两个刺眼趋势：重构行为几乎消失（占比跌破10%），复制粘贴的重复代码暴涨48%。我们在批量制造代码山，然后头也不回地离开。

换句话说，生成式AI解决了语法和样板代码问题，却塞给我们三个隐形头痛：感知错位、重构崩溃、审查瘫痪。

审查税：AI写的PR等待时间暴涨4.6倍

审查税：AI写的PR等待时间暴涨4.6倍

代码审查正在变成精神酷刑。

AI生成的PR（Pull Request，代码合并请求）平均等待审查时间延长了4.6倍。不是审查员偷懒——面对语法完美但业务上下文全盲的代码，大脑会本能抗拒。

审查者被迫扮演考古学家，从一行行"正确"的代码里推测原始意图。这种认知负荷没有计入任何效能仪表盘。

更隐蔽的是修正税。资深工程师现在要把"节省"下来的近30%时间，花在修复AI引入的诡异缺陷上。交易很清晰：创造时间换成了调试时间。

一位团队在Slack里吐槽："Copilot（GitHub的AI编程助手）写的单元测试通过了，但测试的是错误的东西。我们花了两天才意识到它在验证一个根本不存在的业务规则。"

18个月灾难：80%代码库沦为反模式沼泽

18个月灾难：80%代码库沦为反模式沼泽

依赖AI的团队会在第3个月左右撞上一道"意面墙"（Spaghetti Point）。但真正的崩塌发生在18个月后。

届时80-90%的代码库充斥着反模式。重构几乎不可能，因为没人足够理解系统来简化它。你不是在构建架构，只是在盲目堆叠积木。

有个简单的团队自测：如果明天早上关掉Copilot和Claude，你们能在中午前自信地调试一起P0生产事故吗？

答案若是犹豫的"不"，雾已经浓得化不开了。

Anthropic的研究印证了风险：盲目委派任务——只说"给我写个做X的函数"——的工程师，代码理解技能下降了17%。肌肉不用就会萎缩，认知技能同理。

一位架构师在Hacker News留言被高赞置顶："我们团队用AI三个月产出了往年半年的功能。上周核心服务宕机，排查了六小时才发现是AI生成的重试逻辑在特定时序下会死锁。写那段代码的人已经离职，注释写着'由Copilot生成'。"

这不是反对AI编程。这是关于使用方式的警报。

Osmani提出的解药并不复杂：强制要求AI生成的代码附带"认知签名"——谁生成的、基于什么提示、业务假设是什么。把隐性的理解债务显性化，才能纳入技术决策的考量。

另一个被验证的做法是"AI配对编程"而非"AI代写"。工程师先手写伪代码或核心逻辑，AI填充实现细节。人类保留系统地图的绘制权，AI负责加速执行。

GitClear的数据还揭示了一个反直觉现象：完全禁用AI的团队，长期代码健康度反而优于重度依赖团队。中间路线——有节制、有监督地使用——目前看是最优解，但找到平衡点需要持续的刻意练习。

你的团队现在处于哪个阶段？三个月的蜜月期，还是正在穿越18个月的沼泽？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴