2026年5月,微软突然宣布将于6月30日前取消内部大多数工程师的Claude Code许可。这一决定来得猝不及防——仅仅六个月前,微软还在大规模推广这个AI编程工具。真实原因是AI工具按Token计费的账单已经高到连这家市值3.5万亿美元的巨头都承受不起。与此同时,Uber的2026年全年AI预算在前四个月就彻底烧光,英伟达高管公开承认“算力成本远超员工工资”。

01

“吞金黑洞”撕碎预算模型

2025年12月,微软将Claude Code开放给数千名员工,覆盖工程师、产品经理、设计师等多个角色,鼓励大家用AI重塑工作流程。员工确实喜欢这个工具——“也许,太喜欢了”。

打开网易新闻 查看精彩图片

六个月后,一纸通知彻底逆转了局面:6月30日前,负责Windows、Microsoft 365、Outlook、Teams和Surface的“体验+设备”部门必须全部下线Claude Code,在未来数周内将工作流迁移到自家的GitHub Copilot CLI。近10万名微软工程师被要求全员转投。这次断供被内部定义为一次“紧急刹车”,而非有序的工具迁移。

理由极其直白:账单太贵。知情人士透露,叫停的核心原因就是高昂的成本,高到连微软都“感到肉疼”。据媒体还原的内部沟通,这次断供由财务部门主导——工程线一致反馈生产力提升巨大,管理层却选择了强制下线。“账本逻辑,最终战胜了工程师的技术品位”。

打开网易新闻 查看精彩图片

微软的遭遇并非孤例。Uber的处境更加触目惊心。Uber首席技术官Praveen Neppalli Naga在一份内部备忘录中披露:95%的工程师月活使用AI工具,84%已进入“智能体编码”模式,70%的线上提交代码源自AI生成。但代价是灾难性的——原本留给2026年全年的AI专项预算(约34亿美元),在前四个月就消耗殆尽。

Claude Code在Uber的使用数据令人震惊:引入约5000名工程师后,四个月内月度使用率飙升至85%-95%,每位工程师的月度API成本在500至2000美元之间。Naga在备忘录中用了一句话形容自己的处境:“I‘m back to the drawing board”——一切推倒重来。

打开网易新闻 查看精彩图片

英伟达应用深度学习副总裁Bryan Catanzaro在接受Axios采访时也坦言:“对我的团队来说,算力成本远远超过员工成本”。《财富》杂志的调查进一步印证:基于Token计费的AI工具在密集使用时,其小时成本可能超过本应被它们辅助的人类工程师。

02

Token计费如何成为“无底洞”

在深入分析之前,有必要理解Token计费的基本逻辑。

Token计费是当前主流AI模型的定价方式,按模型处理的文本“Token”(约等于0.75个英文单词或0.5个中文字符)收费。每次API调用的费用 = 输入Token数 × 输入单价 + 输出Token数 × 输出单价。

不同模型的价差可达数十倍。例如,Claude Opus 4.1的输出价高达75美元/百万Token,而GPT-5仅需10美元/百万Token。Claude Haiku作为轻量级模型,价格则为1美元/百万输入Token和5美元/百万输出Token。

打开网易新闻 查看精彩图片

这种定价模型设计之初就被隐藏着结构性问题:AI代码生成的典型场景是高Token消耗。Claude Code的典型会话单次消耗超过10万个Token,远高于普通对话的数百Token。

当AI“写”得越多,账单涨得越快——传统软件开发里,工程师写得越多,公司赚得越多;而在AI智能体时代,AI写得越多,付给外部供应商的账单涨得越快。

这就像雇了一个效率惊人的保安,却按他出勤的每一分钟精确计费——当他干活比正规军还勤快时,雇主的财务平衡反而被打破了。

打开网易新闻 查看精彩图片

问题不仅在于单价高,更在于Anthropic在2025-2026年间进行了一系列“变相涨价”。2025年8月28日起,Claude通过改变分词器等机制悄悄推高用户成本。2025年11月,Anthropic开始在企业客户续约时将基于席位的定价计划切换为按使用量计费,不再绑定补贴Token。到2026年4月,Claude Code的日均成本从此前的6美元翻倍至13美元。

Anthropic的增长负责人Amol Avasare也承认,公司现有的订阅计划“不是为此(指当前使用强度)设计的”,使用情况已发生巨大变化。部分企业客户的成本可能翻三倍以上。

打开网易新闻 查看精彩图片

Xiaomi MiMo大模型负责人罗福莉指出,部分第三方工具(如OpenClaw)产生的请求数是Claude原生框架的数倍,按API计费成本将是订阅价格的数十倍。这揭示了一个被长期忽视的成本危机:代理(Agent)模式下,工具链的效率直接决定企业的财务命脉。

03

微软的两难

付费给竞争对手的荒诞剧

在微软停用Claude Code的事件中,最讽刺的一点是:微软不仅是Anthropic的大客户,还是Anthropic的核心基础设施供应商。

微软给OpenAI砸下130亿美元,还在Azure上为竞争对手Anthropic搭建了大部分算力底座。但当自家工程师大规模调用Claude Code时,微软需要按Token向Anthropic付费——等于在给自己最直接的竞争对手输血。

打开网易新闻 查看精彩图片

对微软而言,GitHub Copilot属于“内部核算成本”,资源在Azure内部流动,边际成本极低;Claude Code则是一笔实打实的“外部账单”。即便两者产出完全相同,财务性质也天差地别。“官方辞令是‘战略对齐’。辞令是体面的,账单是藏不住的”。

事实上,微软叫停Claude Code的决定远不止是一笔财务账——“它触及了一个更令这家软件巨头不安的事实:在大模型时代的产业链条上,微软正在丧失定义权”。

这种边缘化的焦虑首先源于深层的技术空心化。微软累计向OpenAI投入超过130亿美元,但其自身的大模型研发长期局限于语音、图像等细分场景,始终未能推出对标GPT-4或Claude的通用基础模型。

打开网易新闻 查看精彩图片

随着2026年4月微软与OpenAI结束排他绑定,“独占OpenAI”这一最后的护城河已然松动,核心AI能力高度依赖外部模型的现实变得再也无法回避。

这种对外部能力的依赖又直接投射到自有产品的竞争力上,形成了令人尴尬的对比:Claude Code在SWE-bench上的得分比基于GPT-4o的GitHub Copilot高出8.3个百分点,跨多文件重构调试完成率达到89%,远远优于Copilot的60%,就连微软内部工程师对Claude Code的满意度也高达91%,展现出明显的工具偏好。

技术空心化和产品短板的连锁效应,最终侵蚀的是整个生态的控制权。2026年4月,Anthropic的企业付费采用率首次以34.4%反超OpenAI的32.3%,新购AI服务的企业中有七成选择了Claude;Claude Code更以54%的市场份额和25亿美元的年化收入,将GitHub Copilot的份额压缩至约25%。

打开网易新闻 查看精彩图片

从当下的状况看,微软底层模型的缺位,使得大量工程师连同他们的开发工作流和使用习惯加速向Anthropic生态迁移,并进一步带动企业客户的集体转移——“AI编程时代的核心入口正在落入他人手中”。

04

微软的战略算计

一场精心安排的实验?

从时间线来看,微软2024年12月启动实验,同时向员工开放Claude Code和GitHub Copilot CLI,希望在真实工程环境中比较两款产品的能力差异。六个月后,微软关掉了对手的工具。

正如体验与设备事业部执行副总裁Rajesh Jha在内部备忘录中所解释的:“当我们开始同时提供Copilot CLI和Claude Code时,我们的目标是快速学习,在真实的工程工作流程中对这些工具进行基准测试……Claude Code在这一学习过程中发挥了重要作用。与此同时,Copilot CLI也为我们带来了一些特别重要的东西:一个我们可以直接与GitHub合作、根据微软的代码库、工作流程、安全预期和工程需求来打造的产品。”用外界的解读来说,微软的策略就是“先让竞品当‘陪练’,学完了就收网”。

打开网易新闻 查看精彩图片

所以弃用Claude Code的最大赢家既不是成本控制部门,也不是改用Copilot的工程师,而是微软自身的AI战略——从依赖外部模型到掌握模型自主权。继推出三款自研AI模型MAI-Transcribe-1、MAI-Voice-1和MAI-Image-2之后,微软又发布MAI-Image-2-Efficient,输出成本再降41%。

每一次降价都在削弱Anthropic和OpenAI的议价能力。微软的计划很清晰:让工程师用竞品工具——做压力测试——收集反馈——快速迭代自家产品——关闭外部访问——完成工具锁定。

账本逻辑和技术战略,在这里达成了完美的共振。