你敢信?去年还打折甩卖的Token,现在加价都抢不到!百度智能云AI与大模型平台总经理忻舟直言:“现在手里有多少Token就能卖多少,整个市场供不应求。”阿里云更夸张,过去5个月Token调用量直接涨了15倍!这东西到底凭啥突然成了AI圈的硬通货?背后四股势力已经悄悄开始了疯狂布局。

打开网易新闻 查看精彩图片

以前Token是打折卖的,甚至卖硬件比卖Token挣得多;现在倒过来,加价都买不到,云厂商还得谨慎分配GPU资源。一边要训练更好的模型,一边要对外卖Token,内部各部门抢卡抢到要算账争夺。

为啥一夜之间变天?核心是真实需求爆发了。

阿里云资深副总裁刘伟光说,Coding成了分水岭:不仅生成新应用,还能让那些“太老搬不上云”的遗留系统借AI Coding重生。更绝的是,非程序员也能“编程”了,自己做报表、分析、预算,生产力直接释放。

而智能体(Agent)的普及更。毛运航(是石科技联合创始人)形容:“还没干啥呢,Token就没了!”Agent每一步操作都耗Token,消耗量直接飙升。

过去大厂考核Token销售很难,因为很多是低质调用(比如拿大模型做数据清洗);现在不一样了,智能体和模型能力升级,真正有价值的应用冒出来,这些都是Token重度用户。

中国工程院院士郑纬民还发现一个转向:行业从MaaS(模型即服务)变成了TaaS(Token即服务)。Token不再只是处理信息的单位,还成了算力消耗的计量、定价的标准,就像水电流量一样,按最小颗粒度收费。

Token成硬通货后,四股力量已经快速布局,每一家都有自己的王牌:

云大厂是最早入局的,优势是全栈能力,有模型、算力、甚至芯片。百度今年提“芯、云、模、体”,阿里云强调“芯、云、模型、推理”一体化。刘伟光说,云大厂的胜负手是性价比,而全栈技术是关键。现在他们还在做“Agent原生”改造,整个云服务体系都要为智能体重做一遍,甚至自己包装Token成应用(比如Coding工具),完成从生产到应用的闭环。

模型公司(比如智谱、Minimax、Kimi)则押注模型本身。他们提供API和Token服务,但自持算力不多,保持轻运营。核心目标是“让模型卖出去”,Token化只是手段。比如天翼云的Token套餐就接入了智谱GLM5模型。

运营商动作也快,5月三大运营商集体推Token套餐,中国电信最积极。他们的优势是有大量数据中心、算力,还有最后一公里的客户触达能力。Token化后,和话费、流量逻辑类似,能像水电一样运营。更重要的是,运营商是国产芯片的大买家,有动力推动国产芯片适配。毕竟现在国产芯片适配新模型要几个月,而模型迭代快,他们能整合生态加速适配。

AI Infra企业是融资热点。以前赚差价算不过账,现在市场从买方变卖方,商业化路径清晰了。比如是石科技做独立第三方国产GPU云生态,硅基流动聚焦MaaS层,无问芯穹做模型和芯片的中间层。毛运航说,国内的机会在国产适配:每款国产芯片架构不同,光靠硬件厂商搞不定,需要他们和芯片商、应用方一起跑通链条。

在所有Token服务方向里,Coding和Agent是最赚钱的。业内人士说,大厂的Coding订阅套餐看似便宜,实际不亏。包月模式下,多数用户消耗量远低于上限,平均下来比单卖Token赚得多。忻舟更直接:“大语言模型进入生产环境后,收入没有上限。”

刘伟光拆解得更透:广告、影视这些市场虽大,但和Coding、Agent比不在一个量级。Coding催生Agent,Agent能独立完成任务提升生产力,这都和大语言模型深度绑定。“我们所有火力都集中在这两个方向,市场比其他模型大太多。”

他观察到,Coding工具出现后,应用发展速度明显加快,一旦“人人Coding”成真,每年产生的应用或Agent数量会是过去的数倍,整个软件行业都会被重塑。

毛运航也说,现在几乎没有不用AI的程序员,Agent兴起更是放大了这个效应。业界讨论最多的就是:如何让代码稳定输出、Agent高效产出。对于未来,大家共识是:有限算力下,提升单位Token生产效率,是释放AI生产力的核心命题。

刘伟光预判,当Token覆盖“一切”时,IT支出结构会彻底改变。软件外包、传统IT采购都要被重塑,Token会像水电一样成为基础设施。但也有人担心,这波Token紧张和芯片供应有关,长远还得看。

不过不管怎样,Token已经改变了AI行业的游戏规则。你觉得未来你的工作会被Agent和Coding影响吗?Token真的能成为像水电一样的必需品吗?评论区聊聊你的看法!觉得有用的话,别忘了点赞收藏转发,让更多人看到AI圈的这波变化。