忘设限制月烧5亿美元，AI省钱神话被戳穿了？|代币|优步|省钱|神话|麦克唐纳

“AI让生产力飙升了吗？我没看到。”Uber新任首席运营官安德鲁·麦克唐纳这段话，最近在网络上激起的不是反驳，而是一片叫好。他的牢骚直指一个肉眼可见的矛盾：一方面AI代币账单越堆越高，另一方面基层员工的生产率曲线并没有按PPT上的节奏上扬。还没等这句话降温，紧跟着就传出Uber工程师已经把2026年度的AI预算提前挥霍干净。

这件事还没消化完，Axios又扒出一个更刺眼的案例：一家未被披露具体名称的公司，居然在短短一个月内烧掉约5亿美元的Claude使用额度。原因离谱得像个段子——忘了给员工设置使用上限。企业采购AI服务时，默认的是“敞开用”模式，没有用量门槛、没有配额预警，等到财务账单弹出来，一切为时已晚。

这起五亿美金的意外，绝不是一家公司的孤立翻车，它更像一面照妖镜，把过去两年行业内对AI降本的神话，照得原形毕露。巨头们当初承诺的“用更少的人干更多的活”“推理成本将指数级下降”，如今被实际运营数据贴上了问号。Costco、达美航空、IBM等品牌的领导者，纷纷在内部或公开场合表达对AI投入产出比的质疑，甚至直言现阶段更愿意保留人力而非盲目替换。与此同时，亚马逊、Meta、微软却在另一边继续削减人頭，两相对比，企业圈对AI的态度分裂已经藏不住了。

要理解这场信用滑坡，得先弄懂一个词：“tokenmaxxing”。它特指一种在AI工具使用上不计后果的烧代币行为——员工无节制调用大模型接口、生成大量重复内容、为了“看起来更智能”而对同一个任务反复请求，活像旧时代机房里的资源浪费。如今意识到账单失控之后，企业高层开始集体抛弃“代币狂欢”的做派。谷歌等云商也在顺势而为，着手打造推理成本更低的新模型和新方法，想给这个过热的市场降降温。

然而，成本能降多少、用量又会飞升多少，这两股力量正在把AI预算拖进一个复杂的拔河游戏。Gartner的一份最新报告抛出了两个足以让财务总监失眠的数字：到2030年，生成式AI模型的单次推理成本会降到2025年的十分之一；但同一份报告也预测，随着人们对AI代理依赖加深、任务流程日益复杂，代币使用量将暴增5到30倍。这意味着，即使单位成本骤降，总账单翻番甚至翻几倍的可能性仍然明晃晃地摆在那里。

云端提供商显然也嗅到了风向的变化。谷歌和Anthropic已经相继转向基于实际使用量的计费模式，并施加更严格的额度限制。这一刀首先砍向了非企业用户，引发了不小的抗议声浪。毕竟，习惯了无限额度的开发者和小团队，突然要盯着每个token精打细算，体验落差可想而知。而另一端，就连那些把未来押注在AI上的大公司也启动了自我纠偏。

微软的转向颇具戏剧性。仅仅在半年前，这家公司还在大举推动各类员工使用Claude服务，如今却掉头开始砍订阅、甚至内部发文劝员工“少用点”。不是说要全面拥抱AI吗？真到算总账的时候，连微软都开始掐自己的预算。从Uber烧光两年额度，到神秘公司忘设上限写下五亿美元罚单，再到Gartner的预警和云商的收紧，AI产业正在被迫回答一个原本不该成为问题的问题：你究竟是来降本的，还是来制造史上最昂贵的实验账单的？