打开网易新闻 查看精彩图片

两年的免费午餐,终于宣告结束。

2026年3月,一场几乎同步发生的集体涨价席卷中国AI圈:腾讯云率先将混元系列模型Token价格上调超400%,阿里云随即跟进,旗下AI推理算力产品涨幅最高达34%,百度智能云同日跟上,新价格统一从4月18日起生效。算上此前智谱取消折扣套餐带来的30%涨幅,中国主流大模型厂商几乎在同一时间窗口内完成了一次默契的"集体转身"。

这不是商业阴谋,而是一道简单的算术题,终于算不下去了。

天量Token吞噬了什么

理解这次涨价,必须先理解Token消耗的量级变化。

国家数据局数据显示,中国日均Token调用量已从2024年初的1000亿,飙升至2026年3月的140万亿,两年时间增长超过千倍。这个数字背后的推手,是AI智能体的爆炸式普及。

过去的大模型主要服务于对话场景:用户提问,模型回答,Token消耗是线性的、可预测的。但智能体完全是另一回事,它需要拆解任务、调用工具、自我纠错、循环推理,完成一次复杂操作背后,往往是普通对话消耗量数十倍的Token在燃烧。

百度千帆大模型平台产品负责人张婷曾用一组数字做过形象说明:按主流模型定价,1元可以让AI写大约1000篇800字作文。但进入智能体时代,用户单日调用费用高达数百元的情况已不罕见。从"几毛钱写千篇文章"到"一天烧掉几百元",这中间的鸿沟,正是算力账本失衡的直观体现。

更深层的压力来自成本端。一张高端GPU动辄数十万元,运行一个大模型需要几十甚至几百张GPU同时工作,再叠加持续攀升的电力成本、模型研发摊销和运维安全投入,当算力成本以指数级增长而定价长期倒挂时,涨价只是迟到的必然。阿里云在官方公告中直接将原因归结为"全球AI需求爆发、供应链涨价,行业核心硬件采购成本显著上涨",措辞坦率,毫无遮掩。

智谱CEO张鹏把这轮涨价定性为"把Token价格回归到正常的商业价值"。这句话说得克制,但言外之意明确:过去两年的价格战,本质上是用亏损换市场,这条路走到头了。

涨价之后,谁能驾驭这匹"野马"

涨价是结果,不是终点。

对于中小AI创业公司而言,这次涨价的杀伤力远比表面数字更大。Token成本翻倍,意味着一个月可能凭空多出数十万乃至数百万元的硬支出,现金流本就紧张的初创团队,将直面生死抉择。而对云厂商和大模型企业自身而言,涨价同样倒逼着一个更根本的问题浮出水面:进入智能体时代,如何让Token不被白白浪费?

答案指向一个在硅谷悄然兴起、如今已登陆中国大厂的新概念:Harness Engineering,即"驾驭工程"。

顾名思义,Harness的本意是马具。如果说大模型是一匹体能惊人、横冲直撞的野马,那么Harness就是一套精良的马具,为AI智能体构建运行环境、约束规则与反馈闭环,让它在完成复杂任务时既可靠又可控,同时尽可能少烧Token。百度智能云相关负责人直接给出了一个结论:"有没有一套好的Harness,Token消耗可能差出数倍。"

来自旧金山的行业报告显示,部署了Harness框架的AI工作负载,在同等任务量下可实现高达77%的成本降低,这一数字在国内实践中同样得到印证。腾讯集团高级执行副总裁汤道生明确表态,AI落地不只是算法题,更是工程题,不同的Harness设计对实际使用效果与Token成本有着显著影响。

百度最新发布的AI智能体产品DuMate已将Harness工程理念原生内置,通过安全沙箱和高危拦截机制为大模型装上"刹车",同时构建执行框架,让模型能自主调用跨应用、跨文件工具解决用户问题。字节跳动旗下的ArkClaw也采用了类似思路,火山引擎总裁谭待将其核心逻辑概括为"框架和模型趋同进化"。

德勤发布的《2026年企业AI现状》报告揭示了一个耐人寻味的数字:尽管80%的受访企业已部署AI工具,但真正能够规模化应用并产生显著商业价值的,仅有15%。这65个百分点的落差,正是Harness工程试图填补的鸿沟,即AI智能体从"能用"到"好用、可控、省钱"之间那段最难走的路。

Token价格重回理性,这只是开始。真正的竞争,才刚刚切换到新的赛道上。