Token 小到只是一个词元,却大到足以牵动 GPU、光模块、光纤、数据中心、运营商、电力系统和产业应用。它既是模型的语言,也是产业的账本。未来真正重要的,不是谁率先喊出 Token 经济,而是谁能够把 Token 变成可持续的生产力、可计量的商业模式、可调度的基础设施,以及可被千行百业使用的智能能力。
本文作者系盘古智库学术委员、数字经济研究院副秘书长张礼立,文章来源于“张礼立数字经济研究”微信公众号。
本文大约5600字,读完约13分钟。
导语
过去两年,人工智能产业最热闹的地方,是模型。谁的参数更大,谁的多模态能力更强,谁的推理更接近人类,谁就更容易站在舆论和资本的中心。可是,一个产业真正进入成熟期以后,决定它命运的往往不是最响亮的概念,而是最基础的计量单位。
在 AI 时代,这个单位正在变成 Token。
Token 原本只是大模型处理文本、代码、图像与多模态信息时的基本切分单位。一个问题被拆成 Token,一个回答由 Token 生成,一次 Agent 工作流背后,可能是成千上万个 Token 在被调用、传输、计算和结算。它看起来很小,却像电力时代的“度”、通信时代的“流量”、云计算时代的“算力时长”一样,正在成为智能经济最基础的价值刻度。
这也是为什么,我们今天讨论 Token,不能只把它看成大模型公司的计费方式。更重要的是,它正在把模型、算力、网络、数据中心、电力、光通信、运营商和产业应用连接成一条新的价值链。过去我们问 AI 能不能回答问题,今天我们开始问:一个社会要让 AI 进入办公、制造、金融、教育、医疗、城市治理和跨境贸易,需要多少 Token?这些 Token 由谁生产、谁传输、谁承载、谁调度、谁买单?
这才是 Token 经济真正值得观察的地方。
OpenAI 在 2026 年公布的信息显示,其 API 每分钟处理超过 150 亿个 Token,企业业务已经占公司收入 40% 以上,并有望在 2026 年底与消费者业务达到相当规模;Codex 等面向代码与 Agent 场景的产品也在快速增长。这个数据的意义不在于某一家公司的规模,而在于它说明 AI 正在从“偶尔使用的工具”,进入“持续运行的生产系统”。
当 AI 被少数人用来写文章、画图、聊天时,Token 只是消费互联网的一个新入口;当 AI 被企业用来写代码、处理合同、生成方案、辅助研发、管理供应链、重构客户服务时,Token 就变成了一种生产性资源。它不再只是语言的碎片,而是智能生产的耗材。
过去的数字经济,是流量经济;未来的智能经济,很可能是 Token 经济。流量经济关心的是人停留多久、点击多少、转发几次;Token 经济关心的是机器替人完成了多少判断、多少推理、多少生成、多少执行。前者改变的是传播方式,后者改变的是生产方式。
01 Token为什么成为AI时代的新电表
每一次技术革命真正进入社会,都会出现一个新的基础单位。工业时代看煤、电、吨、公里和工时;互联网时代看点击、流量、日活和带宽;云计算时代看算力、存储和调用。到了 AI 时代,Token 很可能成为理解产业变化的新入口。
它不是一个孤立的技术词,而是智能经济的运行刻度。因为 AI 的每一次回答、每一次生成、每一次代码补全、每一次智能体任务执行,最终都会落到 Token 的消耗上。Token 越多,意味着智能服务越频繁;单位 Token 成本越低,意味着 AI 越可能从少数高价值场景进入千行百业;Token 调用越稳定,意味着 AI 越接近真正的生产系统。
过去我们评价 AI,常常看模型能力:参数规模、推理表现、多模态水平、上下文长度。但当 AI 进入产业现场以后,企业真正关心的会变成另一组问题:能不能稳定调用?响应是否足够快?单位任务成本能不能下降?数据是否安全?系统是否可审计?能不能和原有业务流程打通?
这时,Token 就不再只是模型公司的计费单位,而成为企业衡量 AI 生产力的基础账本。
您会发现,Token 并不是一个单点变量。它一端连接用户需求和企业流程,另一端连接芯片、网络、数据中心和能源系统。它越小,越容易被忽视;它越多,越会改变产业结构。
02 AI正在从训练时代进入推理时代
AI 的上半场,是训练。训练时代的核心问题,是谁能拥有更大的模型、更大的数据、更强的 GPU 集群。它像建水库,投入巨大、周期漫长、门槛极高,最终形成少数基础模型公司的能力竞争。
AI 的下半场,是推理。推理时代的核心问题,不只是模型有多强,而是模型能否被大量、稳定、低成本地调用。它不像建水库,更像供自来水。真正的考验不是水库有多大,而是千家万户同时打开水龙头时,系统能不能稳定供水,水压够不够,成本能不能降下来。
这也是 Token 增长的根本逻辑。模型训练消耗的是集中式算力,推理消耗的是持续性算力。训练更像一次性资本投入,推理更像长期运营成本。随着 AI 应用从聊天、搜索、内容生成,进入代码开发、企业流程、行业 Agent 和复杂任务自动化,Token 的消耗会从线性增长变成网络化增长。
Agent 的出现尤其关键。一次普通问答可能只是几百到几千个 Token,但一个 Agent 要完成任务,往往需要理解目标、拆解步骤、调用工具、检索资料、生成方案、验证结果、再次修正。它不是一次回答,而是一串连续行动。每一次行动都在消耗 Token。未来真正的 AI 生产力,很可能不是“人问一句,机器答一句”,而是“人提出目标,机器连续工作”。
这意味着,AI 产业的基础设施竞争正在改变。过去的核心是模型训练集群,未来的核心是推理网络:高并发、低延迟、高可靠、可调度、可计量、可审计。换句话说,AI 不再只是一个软件问题,而越来越成为一个工业基础设施问题。
03 资本开支热潮背后,是一场基础设施再工业化
如果看全球科技巨头的资本开支,AI 已经不再是轻资产互联网业务,而是重新把科技行业带回重资产时代。根据多家市场统计与财务跟踪,Amazon、Microsoft、Alphabet、Meta 等超大规模云厂商 2026 年 AI 与数据中心相关资本开支合计可能达到约 7000 亿美元量级,明显高于上一年水平。
这组数字非常重要。它说明 AI 不是简单的“软件升级”,而是一场新的基础设施竞赛。芯片、服务器、内存、交换机、光模块、光纤、液冷、电力、土地、机房、调度系统,都在成为 AI 能否继续扩张的底层约束。
更值得注意的是,AI 基础设施的瓶颈正在从“有没有 GPU”扩散到“能不能把 GPU 有效组织起来”。NVIDIA 在介绍 Blackwell Ultra 平台时强调,其系统与 Spectrum-X Ethernet、Quantum-X800 InfiniBand 等网络平台结合,并为每个 GPU 提供 800Gb/s 数据吞吐能力,以支持 AI 推理模型和云数据中心避免网络瓶颈。这个表述背后的产业含义是:AI 的下一轮瓶颈,可能不是单个芯片的算力,而是大规模算力之间的连接效率。
一个昂贵的 GPU 如果因为网络拥塞、数据等待、内存交换和调度低效而无法满负荷运行,它就不是资产,而是沉没成本。未来 AI 工厂的竞争,不只看谁买到了更多 GPU,还要看谁能把 GPU 组织成更高效率的生产系统。
所以,AI 时代的“工厂”不再只是厂房和流水线,而是由数据中心、芯片集群、光通信网络、电力系统和软件调度共同组成的新型生产装置。过去机器生产商品,今天机器生产智能。
上述数据共同指向一个判断:AI 产业已经从“软件创新周期”进入“基础设施建设周期”。未来真正稀缺的,不只是算法人才,也包括电力、网络、机房、冷却、供应链与系统工程能力。
04 光模块与光纤,为什么突然站到舞台中央
很多人谈 AI,仍然习惯从模型开始。但从产业链看,真正最先被重估的,往往是那些过去不在公众视野中的“连接部件”。
光模块就是其中之一。
AI 集群不是单个 GPU 的表演,而是成千上万张 GPU 的协同。GPU 越多,模型越复杂,推理请求越密集,集群内部的数据交换就越频繁。这个时候,光模块不再只是通信设备里的零部件,而是决定算力能否释放的关键接口。
LightCounting 在 2026 年关于中国光通信市场的报告介绍中提到,中国 AI 集群中的光连接需求在 2024 年和 2025 年显著增长,800G 光模块预计将在 2026—2027 年大规模部署,1.6T 与 3.2T 将随后推进。(LightCounting) 另一份 2026 年市场预测也指出,以太网光模块市场 2024 年增长 93%,2025 年预计继续增长 82%,2026 年预测增长 65%。
这背后不是简单的通信升级,而是 AI 计算结构本身在变化。过去的数据中心更多服务于搜索、视频、云存储和普通互联网应用;今天的 AI 数据中心要服务模型训练、推理、Agent、多模态生成和高频机器协作。人类刷一条短视频,对延迟的容忍可能是秒级;但 GPU 集群中的数据交换,对带宽、时延、抖动和稳定性的要求要苛刻得多。
光纤光缆也是如此。过去它更像连接城市、家庭和基站的通信底座,市场常把它看作周期性材料。但在 AI DC 时代,光纤正在从“连接耗材”变成“算力网络的物理血管”。没有高质量、低时延、高密度的光连接,算力就会变成孤岛。
这也解释了为什么光通信产业正在从传统通信周期,转向 AI 算力周期。过去光纤光缆的需求主要看 5G、宽带、城域网和运营商集采;未来还要看 AI 数据中心、数据中心互联、东西部算力调度、企业推理集群和边缘 AI 节点。它不再只是“把人连接起来”,而是在“把机器连接起来”。
05 数据中心开始面对电力、土地与社会成本约束
如果说 Token 是 AI 的新电表,那么真正的电,也正在成为 AI 的现实边界。
国际能源署(IEA)在《Energy and AI》相关分析中预计,到 2030 年全球数据中心用电量将翻倍至约 945 TWh,接近全球总用电量的 3%;IEA 同时指出,2024—2030 年数据中心用电年均增长约 15%,增速远高于其他部门总用电增长。
美国能源信息署(EIA)的预测也显示,美国电力消费将在 2026 年和 2027 年连续创历史新高,数据中心、AI 与加密货币相关需求是重要推动因素之一。
这意味着,AI 的竞争正在从模型公司之间,扩展到电网、能源、土地、水资源、社区治理和公共政策之间。过去互联网公司扩张,更多占用的是注意力;今天 AI 公司扩张,越来越多占用的是电力和城市资源。前者带来的是信息过载,后者带来的是基础设施压力。
这也是 AI 产业必须正视的问题:如果 Token 的增长不能和能源效率、绿色电力、液冷技术、算力调度、区域布局同步提升,它就可能从技术红利变成公共成本。AI 的发展不能只是“模型越来越聪明”,还必须是“每一个 Token 越来越便宜、越来越低碳、越来越可持续”。
真正成熟的 AI 产业,不是无限堆算力,而是把算力变成一种可治理的公共生产能力。
06 运营商的价值正在被重新理解
在移动互联网时代,运营商常常被看成“管道”。用户在平台上,应用在互联网公司手里,云在大型云厂商手里,运营商似乎只是提供连接。但到了 AI 时代,这一判断需要重新修正。
AI 推理时代需要的不只是流量,而是算力、网络、云、边缘节点、安全体系和数据中心的协同。运营商拥有骨干网络、机房资源、边缘节点、政企客户、云网融合和区域覆盖能力。它们未必是最会讲 AI 故事的公司,却可能是最适合承接 AI 基础设施运营的主体之一。
这尤其符合中国的产业条件。中国有完整的制造业体系、庞大的政企数字化市场、丰富的城市治理场景,也有“东数西算”等区域算力布局。当 AI 进入推理时代后,企业不一定都要自建大模型,但会越来越多地调用模型、部署行业 Agent、重构内部流程。这个过程需要稳定、可计量、可审计、可调度的算力服务。
运营商如果能够真正打通云、网、算、数、安,就不再只是卖带宽,而是在经营 AI 时代的基础设施。过去运营商连接的是人,后来连接的是设备,未来连接的可能是智能体。它们的价值不在于重新成为互联网入口,而在于成为智能经济的底层秩序维护者。
07 投资热潮并不等于产业成熟
但我们也不能被资本开支的热度迷惑。AI 基础设施投资越大,越需要冷静判断它能否转化为有效产能。
这方面,美国制造业回流的经验很值得参考。近年来美国制造业投资规模显著增加,但产能释放并没有同步提升。美国制造业资本支出月均规模从 2022 年约 8200 万美元提升至 2025 年约 2.24 亿美元,但同期产能仅增长约 1.5%;劳动技能、供应链生态、审批周期、政策不确定性等因素,都影响投资向真实产能转化。
AI 基础设施也会面对类似问题。今天宣布建设一个数据中心,并不等于明天就能形成可用算力;买到 GPU,也不等于 GPU 能被高效使用;建成机房,也不等于电力、冷却、网络和客户需求都能匹配;Token 调用增长,也不等于每一个环节都能获得合理回报。
所以判断 Token 产业链,不能只看“谁宣布投资多少”,而要看三个更深的指标。
第一,Token 调用是否真实持续增长。没有应用,算力就是空转;没有企业工作流,Token 就只是消费级娱乐。
第二,单位 Token 成本是否持续下降。只有当推理成本下降,AI 才能从少数高价值场景走向普遍生产场景。
第三,基础设施是否形成协同效率。GPU、光模块、光纤、电力、液冷、数据中心、运营商和云平台,如果不能成为一个系统,投资越大,浪费也可能越大。
产业成熟不是钱花得多,而是系统效率越来越高。
08 中国机会在于建设Token时代的产业底座
中国在 Token 时代的机会,我认为不能简单理解为“做几个大模型”。大模型当然重要,但更大的产业命题是:如何让 AI 深入制造、贸易、金融、教育、医疗、城市、能源、物流和企业服务,形成持续的 Token 消耗场景,并把这些场景转化为产业效率。
中国的优势恰恰在这里。我们有全球最完整的制造业门类,有大量真实复杂的行业场景,有运营商、设备商、云厂商、光通信企业和数据中心产业链,也有工程化、规模化和基础设施组织能力。一旦 AI 从通用问答走向行业 Agent,中国的竞争力就不只是模型参数,而是场景密度、工程能力和产业协同。
这也是中国数字经济下一阶段需要回答的问题:我们是否能够把 AI 从“工具”变成“系统”,从“模型能力”变成“产业能力”,从“单点应用”变成“可复制的行业操作系统”。
未来的竞争,不是谁拥有一个最会说话的模型,而是谁拥有最懂产业的智能系统;不是谁生成内容更快,而是谁让工厂、园区、港口、医院、学校、企业和城市运行得更高效;不是谁消耗更多 Token,而是谁让每一个 Token 更有生产力。
结语:Token很小,但它照见了一个大时代
Token 小到只是一个词元,却大到足以牵动 GPU、光模块、光纤、数据中心、运营商、电力系统和产业应用。它既是模型的语言,也是产业的账本。未来真正重要的,不是谁率先喊出 Token 经济,而是谁能够把 Token 变成可持续的生产力、可计量的商业模式、可调度的基础设施,以及可被千行百业使用的智能能力。
AI 的上半场,是模型告诉世界它能做什么。
AI 的下半场,是 Token 告诉产业,它到底值多少钱。
当 Token 成为 AI 时代的新电表,我们才真正看清:智能经济不是从天上降临的神话,而是一套要被建设、被连接、被供电、被调度、被治理的产业系统。谁能理解这一点,谁才真正理解了 AI 的未来。■
文章来源于“张礼立数字经济研究”微信公众号
图文编辑:张洵
责任编辑:刘菁波
热门跟贴