打开网易新闻 查看精彩图片

2026年4月初,字节跳动火山引擎的一则披露,像手术刀,划破了中国AI产业看似繁荣的表层——旗下豆包大模型日均Token消耗突破120万亿。

这个数字不仅刷新了全球大模型Token消耗的行业纪录,更揭开了一场没有硝烟的战争:互联网大厂们正以真金白银为燃料,展开一场围绕Token的消耗竞赛,而这场竞赛的背后,是算力、资本、场景与未来格局的深度博弈。

120万亿,藏着最直观的产业真相:它相当于2024年初全行业日均Token消耗总量的上千倍,按当前主流Token定价折算,单日消耗成本高达3至5亿元。

当字节、阿里、百度、腾讯等巨头,纷纷踏入日均万亿、十万亿甚至百万亿级的Token消耗门槛,一个共识已经形成:AI时代的竞争,早已从模型参数的比拼,下沉到Token消耗的规模与效率之争。

Token,这个AI处理信息的最小单元,早已脱离了抽象的技术概念,成为智能时代的“通用货币”。

它既是衡量AI算力投入的成本单位,是评估模型效率的核心标尺,更是企业AI竞争力的核心生产资料——就像农业时代的土地、工业时代的能源、互联网时代的数据。

Token正在成为AI时代的“硬通货”。

01 正在成为AI时代的硬通货

大厂竞速:从“烧钱”到分层,一场没有退路的竞赛

数据统计,2024年初,国内日均Token调用量仅为1000亿;两年后的2026年一季度,这一数字飙升至140万亿以上,增长幅度超过1400倍。

数据来源于国家数据局
打开网易新闻 查看精彩图片
数据来源于国家数据局

而互联网大厂,正是这场指数级增长的绝对主力,梯队分化也在这场竞速中愈发清晰。

字节是这场竞赛的“头号玩家”,其增长速度堪称激进。

2024年5月豆包发布时,日均Token消耗仅为1200亿;2025年底,这一数字突破63万亿;2026年3月,仅用3个月时间便实现翻倍,达到120万亿,两年时间增长整整1000倍。

字节的策略清晰而决绝:以场景扩张撬动Token规模,再以规模效应摊薄成本、构建竞争壁垒,用“量”的优势,锁定未来的话语权。

阿里的动作则更为迅猛且战略清晰。2026年3月,阿里巴巴正式成立由CEO吴泳铭亲自挂帅的ATH事业群,将Token提升至集团战略核心,整合通义实验室、MaaS业务线、千问事业部等五大核心力量,构建起“创造Token、输送Token、应用Token”的完整供应链。

目前,千问的日均Token消耗已达十万亿级别。

百度与腾讯则显得相对稳健,走“场景渗透、稳步扩张”的路线,不盲目参与“烧钱大赛”。百度文心一言的日均Token消耗约为数万亿级别,聚焦搜索、智能云与行业解决方案三大核心场景。

腾讯混元的日均Token消耗维持在8-10万亿,深度绑定社交、游戏、企业微信等自有核心场景,依托海量用户实现自然渗透,始终将现金流稳健放在首位,让Token消耗与现有业务生态深度融合,避免盲目扩张带来的成本压力。

这场Token竞赛的本质,从来不是“谁烧的钱更多”,而是“谁能在烧钱的同时,构建起不可替代的优势”。

拆解Token消耗的成本构成,我们能清晰看到大厂竞争的核心痛点与优势所在,而这一切,都围绕着“算力、研发、场景”三大核心层面展开。

打开网易新闻 查看精彩图片

最直接的成本,来自算力与电力的双重消耗。

大模型的Token生成与推理,高度依赖GPU集群的支撑,而当前主流的H100 GPU单卡价格高达10-30万元,大厂动辄部署数万张,仅硬件投入就可达数百亿元,且GPU的生命周期仅为2-3年,需要持续迭代更新,形成源源不断的资本投入。

电力消耗则更为惊人,单张H100 GPU的功耗高达350W,一个万卡集群的单日耗电量就可达84万度。

值得注意的是,中国大厂的核心优势之一,便是西部绿电资源——0.2-0.3元/度的电价,仅为美国的1/5,这成为中国大厂控制Token成本的关键底气。

即便如此,百万亿级Token消耗带来的单日电力成本,仍高达千万元级别。

据测算,日均140万亿的Token调用量,相当于250个中国国家图书馆的资源量,其背后的算力与电力消耗可见一斑。

第二层成本,是模型研发与优化的持续投入。

Token消耗的效率,本质上取决于模型架构的先进性——同样的Token产出,先进的模型架构能大幅降低算力与电力消耗。

字节、阿里等大厂纷纷投入巨资,研发MoE(混合专家模型)架构、动态批处理等核心技术,这些技术能将Token消耗效率提升30%-70%,看似高昂的研发投入,实则是构建成本竞争力的关键:Token产出效率越高,单位Token的成本就越低,在长期竞赛中就能获得更大的优势。

这种研发投入,不是短期的“技术炫技”,而是长期的“成本卡位”。

最核心的消耗,来自智能体与多模态场景的爆发。

传统的对话式AI,单次交互仅消耗数百至数千Token,对整体消耗的拉动有限;而智能体作为“数字员工”,能够自主完成复杂任务,单个企业级用户的单日Token消耗便可突破1亿,目前国内90%的Token消耗,都来自这类高消耗场景。

与此同时,视频、音频等多模态内容的处理,其Token消耗是纯文本的数倍,随着多模态场景的普及,进一步推高了整体Token消耗规模。

Token的定价分层,也清晰体现了成本与价值的对应关系。

英伟达早已将Token分为五个层级,价差高达50倍,国内大厂也遵循这一逻辑:基础版Token面向C端用户,定价低廉,满足日常简单交互需求;企业级、高速版Token面向核心业务场景,定价高昂,以高溢价覆盖成本、实现盈利。这种分层定价,本质上是将Token的“成本属性”与“价值属性”绑定,让高消耗对应高价值,形成可持续的商业闭环。

图来自2026 GTC 黄仁勋演讲公布
打开网易新闻 查看精彩图片
图来自2026 GTC 黄仁勋演讲公布

02 大厂不惜血本到底在争什么

当单日数亿元的成本成为常态,大厂们不惜血本燃烧Token,绝非盲目跟风,而是基于对AI时代的深刻判断,背后藏着三大不可逆转的底层逻辑,关乎未来十年的产业格局。

首先,Token是AI时代的核心生产资料,谁掌握了Token,谁就掌握了数字生产力的主动权。

数字生产力的核心是AI智能体,而Token,就是智能体的“口粮”——没有Token,智能体无法完成自动化作业、数据分析、任务执行,企业的数字化转型也将沦为空谈。

黄仁勋曾预判,未来企业招聘将标配“Token配额”,就像现在企业标配办公电脑一样。大厂们疯狂扩大Token消耗规模,本质上是在抢占数字生产力的“原材料”,通过规模优势,构建起竞争对手难以逾越的壁垒。

其次,Token经济是破解中国经济两大增长瓶颈的关键抓手。

AI革命的核心是生产力,To C端的Token消耗呈线性增长,且多为无效消耗;而To B端的Token消耗呈指数级爆发,是真正的价值增长点。

当前,中国经济面临人口老龄化带来的用工短缺,以及人力成本高企的双重压力——人力成本已占GDP的40%以上,而Token经济能够提供无限量的“数字员工”,不仅能破解用工短缺的难题,还能将人力成本转化为可放大数十倍的数字生产力,瞄准的是数十万亿级的增量蓝海市场。

这也是阿里、百度等大厂纷纷聚焦B端场景的核心原因。

中国拥有三大不可替代的优势:全球最低的绿电成本、最完善的算力基础设施,以及最大的企业服务市场。0.2元/度的绿电,转化为Token后价值可翻50倍,通过网线就能实现“电力不出境,价值通全球”——这是中国大厂相较于OpenAI、谷歌的核心竞争力。

字节、阿里加速Token服务出海,本质上是将国内的成本优势转化为全球竞争力,争夺AI产业的全球定价权,打破欧美企业在AI领域的垄断格局。

从2024年初的1000亿,到2026年一季度的140万亿,中国AI用两年时间,走完了Token消耗的指数级增长历程。

字节的激进扩张、阿里的战略加码、百度腾讯的稳健布局,看似路径不同,本质上都是对智能时代的同一种回应:Token,已经成为数字生产力的核心,成为中国AI参与全球竞争的核心武器。

人类文明的每一次跃迁,都伴随着核心生产资料的变革:农业时代以土地为本,工业时代以能源为基,互联网时代以数据为核,而AI时代,Token正在成为新的生产资料与硬通货。这场围绕Token的暗战,没有旁观者,无论是互联网大厂,还是中小企业,都将被卷入这场变革之中。

大厂们的“烧钱”,不是盲目跟风,而是为未来十年的产业格局奠基;企业们的布局,不是被动应对,而是为自身的生存与发展铺路。

当Token成为衡量价值、分配资源的核心标尺,它所重构的,将不只是AI产业的竞争规则,更是整个商业世界的底层逻辑——一个以Token为核心的全新生产力时代,已经到来。