文 | 舒书
Token正在成为AI时代的通用货币。4月2日,豆包日均Token使用量突破120万亿——按市场定价折算,这背后是每天近千万元的流水、每年数十亿元的新生意。
这条增长曲线值得细看:
- 2024年5月发布时日均1200亿,
- 2025年9月突破30万亿,
- 2025年12月突破50万亿,
- 2026年4月突破120万亿。
从50万亿到120万亿,只用了4个月。Token的增长不是在爬坡,是在起飞。在火山引擎上,累计Token使用量超过一万亿的企业,从去年底的超过100家增长到140家。
Token不再是一个技术概念,它正在变成真金白银的生意。对投资人而言,这是判断AI公司价值的新坐标;对创业者而言,这是理解Token经济的第一课。谁掌握Token的规模、定价和生态,谁就掌握了AI时代的话语权。字节跳动的Token帝国,能走多远?
一、Token经济的底层逻辑Token是什么?
在技术层面,Token是大语言模型处理信息的最小单元,大致对应半个到一个词语。但在经济层面,Token的意义远不止于此——它是智能劳动的计量单位。
回顾历史,每一次生产力革命都伴随着新计量单位的确立:蒸汽时代用“马力”衡量机械力,电气时代用“千瓦时”衡量电力,信息时代用“比特/字节”衡量数据。AI时代,Token正在成为衡量智能劳动的标准单位。
为什么和互联网不一样?
Token经济和互联网经济有一个根本区别:边际成本不趋零。
传统软件遵循“边际成本趋零”定律——代码写完,复制成本几乎为零。但Token经济打破了这一逻辑。每一个Token的生成,都需要消耗真实的算力、电力和芯片资源。豆包每天120万亿Token的背后,是数以千计的GPU集群在持续运转,是每小时数百万元的电费账单。
字节的护城河是什么?
字节跳动的野心,是成为这个新世界里最大的印钞机。日均120万亿Token,140家万亿级企业客户——字节正在用规模建立话语权。火山引擎MaaS业务的目标是2026年超百亿元。
当然,字节不是央行。央行有法定的货币发行权和利率制定权,字节没有。Token的定价完全受市场竞争影响。字节只是在Token这个新兴领域,凭借规模优势成为了最大的发行方。这个地位不是法定的,是市场选择的,也可能被市场夺走。
互联网时代,字节没能成为“流量央行”——流量入口是微信,是百度,是淘宝。但在Token时代,字节正在抢占这个位置。不是通过行政权力,而是通过规模、场景和生态。
而字节的核心护城河,是Token周转率。字节通过抖音、TikTok等C端高频场景,强制提高了Token的燃烧速度。其他厂商的Token可能被囤积,字节的Token被实时消耗。这种燃烧效率才是字节区别于其他厂商的真正壁垒。
二、稳价vs涨价vs价值战
Token定价是当前AI行业最激烈的竞争战场。2023年,GPT-4的API定价约为每百万Token 30美元;到2025年,主流模型的价格已跌至每百万Token不足1美元。但厂商们的策略开始分化。
智谱上调了GLM系列模型的价格。CEO张鹏的逻辑是:聪明模型干复杂任务的消耗量巨大,要逐步回归到正常的商业价值上。
快手推出优惠计划,用性价比路线快速获取更大规模稳定用户。
字节走的是第三条路:稳价。谭待表示,豆包每一代的定价都经过精心设计,定价之后价格不会再变化。他的逻辑是:不能抛开模型价值谈Token价格。下一代模型能力更强,单Token经济价值更高,理论上价格应该涨。但字节选择稳价,赌的是规模够大,单价不涨也能赚。通过极致的性价比确立基础设施地位,最终通过生态繁荣反哺商业价值。
阿里云走的是第四条路:有效Token策略。这不仅仅是商业策略,更是技术架构的胜利。阿里云和趋境科技等厂商正在通过优化KV Cache(键值缓存)命中率来降低成本——让显存利用率从3%提升到90%,用更少的算力做更多的事。这不是价格战,是价值战——用更少的Token做更多的事。
腾讯走的是第五条路:应用战。腾讯选择了一条去Token化的路。它不完全卖Token,而是卖应用和智能体(Lobster/多比)。腾讯试图通过微信和多比,将Token彻底黑盒化。如果用户只感知到多比这个智能助手,而感知不到背后的模型是谁,字节引以为傲的豆包品牌和Token定价权,在腾讯的社交壁垒面前,可能会面临有价无市的尴尬。
五种策略,五种选择。字节的稳价策略有风险:如果模型能力提升不如预期,稳价就是亏损;如果竞争对手用价值战切走高质量客户,稳价可能失去的不是价格,是客户。但字节的底气在于:它有场景、有数据、有用户,这是其他模型厂商不具备的。
三、收编龙虾:字节的基建化卡位
字节同时押注两条产品线:豆包是大众化的AI助手;ArkClaw是开发者的智能体工具。
这里需要厘清一个关系:OpenClaw是一个引发智能体热潮的开源社区项目,而字节的ArkClaw是在这个生态上的布局。字节没有收购OpenClaw,而是做了两件事:一是推出ArkClaw,成为OpenClaw生态中的重要玩家;二是搭建ClawHub中国镜像站,解决国内开发者访问Skills的及时性和稳定性问题。
字节的角色是收编和基建化。它不仅仅是做了一个工具,而是通过搭建镜像站,成为了OpenClaw生态在中国的基础设施提供商。这种卡位动作不仅仅是技术上的,更是地缘性的——解决国内开发者访问慢、不稳定的问题,这是字节的本土化战略优势。
谭待的判断是:不是每个人都需要龙虾,但比例可能是20%到30%。按中国互联网用户10亿计算,20%就是2亿人。他还提出了一个更本质的框架:企业Agent需求将沿双路径并行发展。一是敏态Agent,以ArkClaw为代表,重在提升个人生产力;二是稳态Agent,企业可实现AI实践流程化、规模化落地,重点解决组织生产力问题。两条腿走路,既抓个人用户,也抓企业客户。
这是字节从产品公司向平台公司跃迁的关键一步。
四、字节的Token赌局
字节赌的是:Token规模会指数级增长,单价即使不涨,总盘子也足够大。智谱赌的是:Token单价应该反映其经济价值,复杂任务应该收更贵的钱。阿里云赌的是:Token的价值在于有效调用,不是数量。谁对谁错?取决于AI能力提升的速度。
如果AI能力快速提升,字节的稳价会损失利润;如果AI能力提升缓慢,智谱的涨价会失去用户。如果有效Token的逻辑成立,阿里云可能笑到最后。但字节有一个其他厂商没有的优势:场景。字节有抖音、头条、TikTok,有海量的用户和内容,有天然的Token消耗场景。其他模型厂商要花钱买流量、买用户,字节的Token从自己的生态里就能长出来。
当然,也有人对字节的Token帝国持怀疑态度。
质疑一:C端依赖的可持续性。字节的Token消耗高度依赖抖音、TikTok等C端场景。如果短视频AI化遇到瓶颈,比如用户对AI生成内容产生审美疲劳,或者监管对AI内容提出更严要求,字节的Token增长曲线会不会陡降?字节的“印钞机”依赖的是持续的“燃烧”,一旦燃烧速度放缓,整个飞轮就会减速。
质疑二:ToB基因的薄弱。字节在B端企业服务上的积累远不如阿里云、腾讯云。阿里云有十多年的政企客户沉淀,腾讯云有广泛的开发者生态,而字节的ToB基因相对薄弱。它的MaaS百亿目标,靠什么支撑?是靠豆包的C端流量反哺,还是靠火山引擎从零到一的突破?目前来看,两者都面临不小的挑战。
质疑三:开源模型的围剿。字节试图卡位开源生态的工具链,但真正的风险在于模型权重的免费化。如果Meta或Kimi把模型能力做到极致且免费,开发者可能会绕过字节的基建,直接在本地私有化部署。字节的基建化策略,本质上是在与完全去中心化的开源精神赛跑。
这些质疑,字节还没有给出令人信服的答案。火山引擎曾定下2026年MaaS业务收入超百亿元的目标。更早之前,团队在2021年的业务BP中立下过1000亿元的年收入目标。“我们去年就已经把BP改了,提了不少。”谭待说。
五、Token经济的终极命题
站在更长的历史维度看,Token经济的兴起,是人类经济史上第三次重大的劳动形态转变。
第一次转变:农业时代,人类将体力劳动外包给牲畜,解放了人力,催生了文明。
第二次转变:工业时代,人类将机械劳动外包给机器,解放了体力,催生了现代经济。
第三次转变:AI时代,人类正在将认知劳动外包给大模型,解放脑力,其经济影响将远超前两次。
Token,正是这场认知劳动外包的结算凭证。豆包日均120万亿Token,意味着每天有相当于数亿人工时的认知劳动,被AI系统以极低的成本完成。这不是效率的提升,而是生产函数的根本性改写。
未来的AI战争,表面是模型的智力竞赛,实则是能源与认知的双重战争。英伟达在硅片上压低Token的生产成本,字节跳动在生态里扩大Token的消费规模。谁能把Token的成本降到像工业用电一样低廉,谁能把认知劳动的效率提升到像流水线一样标准,谁就是真正的王。一个在上游定义算力的极限,一个在下游定义智能的边界。
Token正在成为AI时代的通用货币,而字节跳动,已经在印钞了。
热门跟贴