一天前,CNBC披露了一个正在美国企业界蔓延的现象:AI月度账单正变得不可控制。旧金山一家仅25人的公司Lindy,其CEO弗洛·克里维洛发现,公司调用大模型的费用竟然超过了支付给所有员工的工资总和。
“别小看AI账单,这关乎企业的生死存亡。”克里维洛向CNBC诉苦时说道。这家公司此前主要使用Anthropic的Claude模型,但在本月初,他做出了一个彻底的决定——将全部流量100%切换至DeepSeek。他预计,这项调整在未来几个月能为公司节省数百万美元。克里维洛还展示了一条令人心惊的成本曲线:“简直是断崖式下跌。”
打开网易新闻 查看精彩图片
有过五年Uber工作经历的克里维洛透露,他的老东家目前也在严苛收紧AI预算。本月,Uber为部分AI工具划定了分级支出上限,基础档位被限制在每月1500美元。这种收紧并非个案。咨询公司Highspring的Jeff Henry告诉CNBC,一些客户已经决定先全面暂停AI投入,直到能拿出明确证明投资回报率的数据后再谈下一步。
AI支出最先失控的领域在哪里?CNBC采访的多位分析师和企业管理层给出了同一个答案:辅助编程。开发者们在调用模型进行新工具和新服务的开发时,Token消耗量惊人。而现在,企业开始反向操作,他们推行一种名为“模型路由”的策略,核心原则是按任务匹配模型,不再让最昂贵的前沿模型包揽所有场景。这意味着,简单任务被分流到更轻量、更便宜的模型上。
这股风潮被概括为一个关键词:Tokenminimizing,即追求用更少的Token完成同等复杂度的任务。当“烧钱竞赛”暂告一段落,如何精打细算地调用每一笔算力,正在成为美国企业保住AI预算的关键。
热门跟贴