新闻分析｜“token工厂”开启算力经济新逻辑|token|工厂|新模型|新闻分析|电力|算力经济|黄仁勋

新华社北京3月20日电　新闻分析｜“token工厂”开启算力经济新逻辑
　　新华社记者葛晨
　　随着人工智能（AI）在全球范围的加速落地，行业焦点正从大模型的集中训练阶段，快速演进至规模化应用与商业变现阶段。
　　近日在美国英伟达公司年度GTC大会（GPU技术大会）上，英伟达创始人兼首席执行官黄仁勋提出“token 工厂”概念，认为行业竞争已从大模型时代发展到token产能时代，“未来的数据中心不再是存储文件的仓库，而是生产token的‘工厂’”；对相关企业来说，“计算能力等同于收入”。

从“电子仓库”到“token工厂”

在AI世界里，token是指词元，即模型处理和生成信息的基本单位，可以是一个词、一段代码，甚至是图像与视频中的一个像素区块。简单来说，AI不直接认识字或词，而是通常把语言切割成词元，再映射成AI可以理解和处理的数字ID。当用户向AI提问，AI经过深度推理输出一段分析报告或生成一段高清影像时，首先就是高频次、大规模地生成了一系列词元。
　　伴随这一过程，数据中心的角色正在发生根本性转变。传统意义上的数据中心主要用于数据的静态存储和网络交换，被业界视为“电子仓库”；如今随着AI智能体开始自主调用工具、执行复杂逻辑任务，数据中心正全面转变为持续吞吐海量数据并输出智能内容的“token工厂”。
　　业内普遍认为，无论是所谓“token工厂”还是AI工厂，其实质就是把数据中心重新定义成智能产线：输入是电力、数据、模型和调度系统，输出则是AI智能体的执行能力和行业场景中的实际生产率。

每瓦特token，定义AI时代的“生死线”

黄仁勋在演讲中将token比作数字经济时代的“硬通货”，认为在既定的电力和空间资源约束下，数据中心产出token的速度、质量和成本，将直接决定科技企业能否存活，因此每瓦特电力的token吞吐量将替代传统的“服务器数量”“存储容量”成为决定数据中心竞争力与营收的核心指标。
　　在未来的AI服务体系中，token成为可计价的数字商品，AI服务按吞吐量、速率、智能密度等为它分层定价。免费层级的token吸引更多客户，而高端层级的token服务于最有价值的客户。
　　相关观点已经得到业内广泛认同。知名风险投资机构红杉资本公司在一份行业观察报告中指出，GPU计算正日益商品化，充裕且低成本的算力已成为支撑数字经济运转的基础设施。美国斯坦福大学发布的2025年人工智能指数报告显示，得益于小型模型的能力跃升，执行GPT-3.5级别系统的推理成本在2022年11月至2024年10月间骤降280多倍。
　　黄仁勋在演讲中说，随着模型越来越大、上下文越来越长，AI会变得更“聪明”，但token的生成速率会降低，因此架构优化至关重要。在GTC大会上，英伟达宣布将推出新一代AI计算平台“薇拉·鲁宾”，每瓦特性能预计将达到上一代系统的10倍。英伟达同时展示了可容纳256个语言处理单元（LPU）的配套机架系统，该系统与“薇拉·鲁宾”平台协同工作，可将每瓦特词元生成效率提升约35倍。

全球加紧算力布局

全球半导体供应链与云服务商的研发焦点，正全面转向提高单位瓦特下的词元产出率，核心目标都是在有限的能源供给下，让算力设施产出更多的“硬通货”。
　　除了电力供应，AI产业还面临物理空间、冷却水资源等多重约束。在此背景下，能源瓶颈促使全球算力布局加速与绿色转型深度融合。一段时间以来，全球大型科技企业正密集地向核电、地热等清洁能源领域延伸投资。
　　2025年6月，美国亚马逊公司与塔伦能源公司宣布达成长期协议，将从塔伦能源旗下的萨斯奎汉纳核电站获得1920兆瓦电力供应，以用于亚马逊云科技公司的数据中心，双方还在考虑合作建造小型模块化反应堆和为核电站扩容。同年10月，谷歌公司公布一项计划，将重启位于美国艾奥瓦州一座核电站，为其AI基础设施供电。
　　面对“token工厂”带来的产业重塑，许多经济体已认识到，掌握算力意味着掌握数字经济的定价权与数据安全的主动权。
　　从欧洲到中东，许多国家正斥巨资建立本土数据中心，以确保其AI模型能够基于本国语言、文化和价值观进行训练和内容生成，避免在数字经济底层基础设施上过度依赖跨国巨头。根据德国政府本月17日公布的一项数据中心扩容战略规划，到2030年，德国通用数据中心的算力将在2025年基础上至少翻一番。新增的数据中心容量将优先由德国和欧洲企业建设，以减少德国对欧洲以外大型云服务提供商的依赖。（完）