“AI让生产力飙升了吗?我没看到。”Uber新任首席运营官安德鲁·麦克唐纳这段话,最近在网络上激起的不是反驳,而是一片叫好。他的牢骚直指一个肉眼可见的矛盾:一方面AI代币账单越堆越高,另一方面基层员工的生产率曲线并没有按PPT上的节奏上扬。还没等这句话降温,紧跟着就传出Uber工程师已经把2026年度的AI预算提前挥霍干净。

这件事还没消化完,Axios又扒出一个更刺眼的案例:一家未被披露具体名称的公司,居然在短短一个月内烧掉约5亿美元的Claude使用额度。原因离谱得像个段子——忘了给员工设置使用上限。企业采购AI服务时,默认的是“敞开用”模式,没有用量门槛、没有配额预警,等到财务账单弹出来,一切为时已晚。

打开网易新闻 查看精彩图片

这起五亿美金的意外,绝不是一家公司的孤立翻车,它更像一面照妖镜,把过去两年行业内对AI降本的神话,照得原形毕露。巨头们当初承诺的“用更少的人干更多的活”“推理成本将指数级下降”,如今被实际运营数据贴上了问号。Costco、达美航空、IBM等品牌的领导者,纷纷在内部或公开场合表达对AI投入产出比的质疑,甚至直言现阶段更愿意保留人力而非盲目替换。与此同时,亚马逊、Meta、微软却在另一边继续削减人頭,两相对比,企业圈对AI的态度分裂已经藏不住了。

要理解这场信用滑坡,得先弄懂一个词:“tokenmaxxing”。它特指一种在AI工具使用上不计后果的烧代币行为——员工无节制调用大模型接口、生成大量重复内容、为了“看起来更智能”而对同一个任务反复请求,活像旧时代机房里的资源浪费。如今意识到账单失控之后,企业高层开始集体抛弃“代币狂欢”的做派。谷歌等云商也在顺势而为,着手打造推理成本更低的新模型和新方法,想给这个过热的市场降降温。

然而,成本能降多少、用量又会飞升多少,这两股力量正在把AI预算拖进一个复杂的拔河游戏。Gartner的一份最新报告抛出了两个足以让财务总监失眠的数字:到2030年,生成式AI模型的单次推理成本会降到2025年的十分之一;但同一份报告也预测,随着人们对AI代理依赖加深、任务流程日益复杂,代币使用量将暴增5到30倍。这意味着,即使单位成本骤降,总账单翻番甚至翻几倍的可能性仍然明晃晃地摆在那里。

云端提供商显然也嗅到了风向的变化。谷歌和Anthropic已经相继转向基于实际使用量的计费模式,并施加更严格的额度限制。这一刀首先砍向了非企业用户,引发了不小的抗议声浪。毕竟,习惯了无限额度的开发者和小团队,突然要盯着每个token精打细算,体验落差可想而知。而另一端,就连那些把未来押注在AI上的大公司也启动了自我纠偏。

微软的转向颇具戏剧性。仅仅在半年前,这家公司还在大举推动各类员工使用Claude服务,如今却掉头开始砍订阅、甚至内部发文劝员工“少用点”。不是说要全面拥抱AI吗?真到算总账的时候,连微软都开始掐自己的预算。从Uber烧光两年额度,到神秘公司忘设上限写下五亿美元罚单,再到Gartner的预警和云商的收紧,AI产业正在被迫回答一个原本不该成为问题的问题:你究竟是来降本的,还是来制造史上最昂贵的实验账单的?