当越来越多企业高喊"All in AI"时,一个新的产业现实正在形成:真正决定AI商业价值的,已经不是模型参数,而是Token产能。谁能以更低成本、更高效率、更稳定的吞吐能力生成Token,谁就掌握下一轮AI基础设施的话语权。

从GPU集群到推理平台,从算力调度到电力系统,整个AI产业链的重心正在从"训练中心"转向"Token工厂"。而这场转变,也正在重塑云厂商、运营商、数据中心乃至能源公司的角色边界。

打开网易新闻 查看精彩图片

AI重心正由训练转向推理,Token效率成核心

过去两年,全球AI产业最热闹的叙事,是大模型参数竞赛。模型从千亿走向万亿,训练GPU数量从数千张堆到十万卡,几乎所有科技公司都在强调自己的模型能力。但到了2026年,一个越来越明显的趋势是,市场开始不再为"参数"买单,而开始为"Token产出效率"定价

原因非常现实。训练一个大模型,也许只发生一次;但Token生成,却每天都在持续发生。用户每一次提问、每一次Agent调用、每一次视频生成,本质上都在消耗Token。模型训练属于一次性资本开支,推理运行才是持续性长期运营成本。对于绝大多数AI公司而言,真正烧钱的阶段,已经从"训模型"转向"养模型"。

于是,一个新的产业词汇正在被频繁提及——Token工厂正如黄仁勋所提到的,“行业竞争已从大模型时代发展到Token产能时代,未来的数据中心不再是存储文件的仓库,而是生产Token的工厂。”衡量AI公司的核心指标,也从参数规模,逐渐变成Token吞吐量、首Token延迟、每Token生成时间、推理成本以及单位Token利润。

这背后其实意味着AI产业逻辑发生了根本变化。上一轮云计算时代,云厂商卖的是虚拟机和存储;如今AI基础设施卖的,则是Token。GPU不再只是算力芯片,更成为核心的"Token生产设备"。数据中心也不再只是IDC,而是类似现代工业中的自动化流水线。

更关键的是,Token天然具备"货币化"属性。用户很难感知GPU利用率,但会直接感知一次对话消耗多少Token、一次视频生成消耗多少额度。于是,整个AI商业模式开始向"Token经济"收敛。API厂商卖Token,Agent平台卖Token,企业AI系统也在内部核算Token成本。

这让AI产业第一次出现了类似电力行业的特征。过去早期电厂主要比拼装机容量,如今AI公司比拼的核心则是Token产能。谁拥有更低电价、更高推理效率、更稳定系统调度,谁就拥有更强竞争力。模型能力的重要性没有消失,但它正在从"核心壁垒"变成"基础能力"。

一个颇具争议性的现实也开始浮现:未来真正赚钱的,也许不是最强模型公司,而是最强Token工厂运营商。因为大模型能力正在趋同,但推理成本差距却可能达到数倍。最终决定利润率的,不是模型会不会写诗,而是Token能不能便宜地产出来。

打开网易新闻 查看精彩图片

GPU集群正在"工业化",AI数据中心开始像发电厂

如果说2023年的AI基础设施还带有明显实验室气质,那么2026年的AI数据中心,已经越来越像重工业系统。行业开始讨论的不再只是GPU型号,而是PUE、液冷密度、电力容量、推理调度和Token吞吐效率。AI基础设施的"工业化"特征正在迅速增强。

这背后最直接的变化,是推理流量开始全面超过训练流量。大量互联网公司发现,真正长期消耗GPU资源的,不是模型训练,而是持续不断的在线推理请求。尤其Agent兴起后,一个复杂任务往往会触发几十甚至上百次模型调用,Token消耗呈指数级增长。

于是,AI数据中心开始发生结构性变化。过去训练集群追求极致互联带宽,现在推理集群更强调稳定吞吐与低时延调度。GPU利用率不再只是技术指标,而直接决定企业利润。很多AI公司甚至发现,同等硬件条件下,不同智能调度系统的Token产出效率差距可达40%以上。

更大的变化来自电力。过去数据中心谈论"机柜上架率",如今AI园区衡量标准变成"多少瓦特能产出多少Token"。国外一些超大型AI园区甚至开始直接绑定天然气电厂与核电资源,以此锁定稳定、低成本的电力供给。本质上就是因为AI产业已经从信息产业,逐渐演化成能源密集型产业。

这也是为什么越来越多人把AI数据中心称为"数字炼油厂"。它们吞进去的是电力、芯片和冷却能力,吐出来的是Token。Token不再只是技术单位,而开始成为一种新的数字商品。谁拥有更便宜能源、更强散热系统、更成熟调度能力,谁就能更低成本生产Token。

这种工业化趋势,也正在重塑产业链角色。过去运营商更多提供网络连接,现在开始参与智算园区建设;过去传统IDC强调机柜出租,现在则开始向"Token基础设施运营商"转型。

但问题也随之而来。当AI基础设施越来越像工业系统,行业是否会走向产能过剩?今天全球大量资本仍在疯狂建设AI园区,但真正能够持续产生高价值Token需求的应用,仍然有限。一旦Token价格快速下跌,大量高成本AI园区可能会迅速沦为"鬼数据中心"。

打开网易新闻 查看精彩图片

Token价格战,正在摧毁AI行业最初的盈利幻想

过去两年,大模型行业最流行的商业逻辑,是"先烧钱,后垄断"。许多人相信,只要模型足够强,就能像搜索引擎一样形成赢家通吃。但现实却是,随着模型能力逐渐趋同,AI行业正在迅速陷入Token价格战。

这种变化已经非常明显。过去调用高级模型API的成本极高,而如今行业同质化加剧,叠加开源模型与国产模型普及,Token市场价格被持续压低。越来越多企业发现,用户并不一定在意模型参数规模,而更在意响应速度、使用成本和稳定性。

于是,AI行业开始进入一个极其残酷的阶段:Token成为同质化商品。当不同模型之间能力差距缩小时,价格就会成为核心竞争手段。多数中小AI创业公司表面用户增长迅猛,但实际上Token收入甚至无法覆盖GPU折旧与电力成本。

更危险的是,Agent浪潮正在进一步放大这一矛盾。Agent确实提升了Token消耗量,但同时也让Token价格透明化。企业客户会非常直接计算:一次任务到底消耗多少Token、对应多少成本、ROI是否成立。过去"模型智能"的叙事,开始被"Token性价比"替代。

这导致整个AI行业出现一个巨大悖论。一方面,Token需求在爆炸;另一方面,Token利润率却在持续下降。越来越多AI公司发现,自己像一家高负债制造企业,而不是高毛利软件公司。GPU折旧、能源成本、网络互联、冷却系统,都在吞噬利润。

于是,行业开始出现新的分化。拥有自建数据中心、自研芯片、自有云平台的巨头,能够通过规模效应压低Token成本;而大量依赖租赁GPU的AI创业公司,则被迫卷入价格战泥潭。最终,AI竞争越来越像钢铁、电力和云计算行业,而不是传统互联网。

这也是当前AI产业最具争议性的地方。很多人仍把AI视为"软件革命",但现实却越来越接近"重资产工业革命"。未来决定AI公司生死的,可能不是模型幻觉率,而是每百万Token的边际利润。所谓AI革命,正在被拉回最传统的产业规律:成本、产能与规模。

打开网易新闻 查看精彩图片

Agent爆发之后,世界将进入"Token通胀时代"?

真正改变Token经济结构的,并不是聊天机器人,而是Agent。聊天机器人本质上仍是单轮对话,但Agent意味着持续调用、自动决策与长链路任务执行。一个复杂Agent任务,背后可能对应数百次模型推理。

这意味着,Token消耗将出现结构性爆炸。过去一个用户一天可能只产生几千Token,但Agent时代,一个企业工作流可能每天消耗数百万甚至数亿Token。AI开始从"人类主动使用",转向"机器持续调用机器"。

于是,一个新的问题开始浮现:Token会不会像互联网流量一样,最终进入"通胀时代"?过去大家担心GPU不够,如今更多人担心的是,整个世界会不会被无穷无尽的Agent请求淹没。因为Agent之间可互相联动调用,形成无人工干预的Token消耗闭环。

一些云厂商已经观察到类似现象。越来越多Token,并不是由真人用户产生,而是由AI系统自动生成。未来企业内部的大量软件系统,都可能演变成A2A(AI-to-AI)通信网络。人类不再直接操作软件,而是由Agent持续调用模型完成任务。

这将彻底改变互联网基础设施结构。过去CDN传输的是图片和视频,未来网络传输的核心对象,可能是Token流。过去数据库存储的是结构化信息,未来企业真正重要的资产,可能是高质量上下文与长期记忆系统。

但"Token通胀"也意味着资源浪费。大量低价值Agent调用,或将持续消耗GPU、电力与网络资源。一些行业人士已经开始质疑:今天AI行业是不是正在制造新的数字泡沫?因为许多Token消耗,并未真正产生商业价值。

更现实的问题在于,Token通胀最终会把AI产业重新拉回能源约束。无论模型多先进,每一次Token生成都需要真实电力支撑。当全球Agent数量达到数十亿级别后,真正限制AI扩张速度的,也许不是算法,而是电网

打开网易新闻 查看精彩图片

谁掌控Token工厂,谁就掌控下一代数字世界

过去互联网巨头掌控流量入口;云计算时代,科技巨头掌控底层云基础设施;而AI时代,真正的核心控制权,正在转向Token工厂。因为所有AI应用、Agent系统、企业智能化流程,最终都需要Token供给。

于是,一个全新的产业权力结构正在形成。上游是能源、电力与芯片;中间是Token工厂运营商;下游则是各种Agent与AI应用。真正掌握利润与议价权的,很可能不是最会做应用的企业,而是最能稳定供应Token的企业

这也是为什么越来越多科技巨头开始重资产化。它们疯狂购买GPU、建设核电合作项目、布局液冷园区、开发ASIC芯片,本质上都在争夺未来Token生产能力。AI竞争的终局,已经越来越像一场现代工业体系竞争。

而对于我国市场而言,这种变化尤其值得关注。过去互联网擅长流量运营,但AI时代真正重要的,可能是能源组织能力、基础设施效率与大规模工业调度能力。从某种意义上说,AI产业正在重新奖励"工业能力"

这也是一个极具争议的判断:未来最成功的AI公司,未必诞生于纯软件研发团队,而可能诞生于最懂能源、制造和基础设施运营的企业。因为当Token成为新的工业品后,AI行业比拼的将不只是算法,而是整个工业体系效率。

某种意义上,AI时代正在让虚拟互联网产业重新实体化、重资产化。过去数字经济强调轻资产、高毛利与无限扩张;而Token经济却让产业重新面对电力、土地、冷却、供应链与资本开支。AI不再漂浮在云端,而开始深深扎进现实工业体系。

这或许才是"Token工厂"真正值得警惕的地方。它不仅意味着AI产业升级,更意味着科技行业正在从"代码经济"转向"能源经济"。未来世界的核心问题,也许不再是谁拥有最多用户,而是谁拥有最多稳定、廉价、持续生产Token的能力。

智算产业顶级盛会来袭!

2026 中国智算产业生态发展年会将于6 月 30 日深圳盛大启幕。本届大会以"AI 入场景,Token大时代"为主题,设置主论坛、供需交流会、年度评选、闪话:智算引力现场、创新成果展等多元环节,汇聚大模型企业、算力基础设施提供商(芯片、服务器等)、算力服务商、行业用户,共同探讨智算产业从建设走向应用、从技术走向生态的关键路径。

扫描二维码立即免费申领大会门票

打开网易新闻 查看精彩图片