文 | WQS
审核 | 子扬 校正 | 牧歌
2025年,一场由Token驱动的AI算力革命正重塑全球科技产业格局,云厂商集体涨价、大厂战略转向、国产模型崛起,背后是算力需求指数级增长与供给失衡的深层矛盾。
当AI竞争从“拼模型”转向“争算力”,Token已从技术概念演变为智能时代的“硬通货”,其定价权之争将决定未来商业生态的主导权。
Token消耗激增直接推高算力成本。
国家数据局数据显示,中国日均Token调用量从2024年初的1000亿飙升至3月的140万亿,两年增长超千倍。
云厂商被迫调价:阿里云、腾讯云最高涨幅超30%,亚马逊AWS、谷歌云更早于今年1月打破“降价惯性”。
笔者观察到,这场涨价潮的本质是算力供需失衡——智能体编程工具OpenClaw的流行,使单任务算力消耗放大30-100倍,部分场景甚至达1000倍。一名学生写论文消耗1万Token,而智能体执行简单任务可能触发百万Token消耗,用户“烧Token”速度远超预期。
国产模型凭借性价比优势成为最大受益者。Kimi近20天收入超2025全年预期,Minimax、智谱股价创新高,但算力依赖症暴露无遗——Kimi频繁提示“算力不足”,MiniMax直接限流。
笔者认为,国产模型的崛起本质是“算力套利”:它们通过租赁阿里云、腾讯云等基础设施,以低成本抢占市场,但云厂商的GPU采购成本与数据中心建设投入,最终通过Token涨价向下游传导。火山引擎2025年营收超200亿,阿里云资本支出达1238亿,卖算力的收入增速仍难覆盖硬件投入。
科技大厂的战略转向揭示Token经济学的深层逻辑。英伟达黄仁勋提出“Token工厂”概念,通过收购Groq补齐推理短板,用Vera CPU实现智能体实时调度,构建从芯片到应用的闭环生态。其分层定价策略将Token价格与算力性能直接挂钩,掌握定价权。
阿里则成立ATH事业群,推出企业级平台“悟空”,覆盖电商、制造等十大场景,将Token消耗嵌入企业工作流。笔者发现,大厂的目标已从“卖算力”转向“控制Token生命周期”——从生产、分发到应用,通过绑定客户算力需求形成迁移壁垒,最终将人力资源成本转化为可量化的数字生产力。
Token争夺战的本质是生产资料控制权之争。火山引擎凭借抖音、剪映的亿级用户场景,形成“算力-模型-场景”闭环,豆包大模型日均调用量超100万亿,成为全球第三大Token消耗方。阿里设定2026年国内AI云市场增量80%的目标,与火山引擎的14.8%市场份额形成直接对抗。
这场竞争将重塑AI商业规则:
- 过去比拼模型参数,未来争夺Token定价权;
- 过去依赖互联网轻资产模式,未来拥抱算力基建重资产;
- 过去通过免费策略吸引用户,未来将Token消耗与业务增长深度绑定。
当OpenClaw等工具让AI从“对话”走向“干活”,Token已不再是技术术语,而是智能时代的“石油”。科技大厂能否将算力优势转化为可持续的商业模式,取决于能否平衡“生产-分发-消耗”的效率链。但AI的进化速度远超人类预期,就像无人预料到智能体会突然爆火一样,Token经济的终极形态仍充满变数。
目前唯一确定的是:能让普通人用好的AI,才是最有价值的AI。
热门跟贴