新华社北京3月20日电 新闻分析|“token工厂”开启算力经济新逻辑
新华社记者葛晨
随着人工智能(AI)在全球范围的加速落地,行业焦点正从大模型的集中训练阶段,快速演进至规模化应用与商业变现阶段。
近日在美国英伟达公司年度GTC大会(GPU技术大会)上,英伟达创始人兼首席执行官黄仁勋提出“token工厂”概念,认为行业竞争已从大模型时代发展到token产能时代,“未来的数据中心不再是存储文件的仓库,而是生产token的‘工厂’”;对相关企业来说,“计算能力等同于收入”。
从“电子仓库”到“token工厂”
在AI世界里,token是指词元,即模型处理和生成信息的基本单位,可以是一个词、一段代码,甚至是图像与视频中的一个像素区块。简单来说,AI不直接认识字或词,而是通常把语言切割成词元,再映射成AI可以理解和处理的数字ID。当用户向AI提问,AI经过深度推理输出一段分析报告或生成一段高清影像时,首先就是高频次、大规模地生成了一系列词元。
伴随这一过程,数据中心的角色正在发生根本性转变。传统意义上的数据中心主要用于数据的静态存储和网络交换,被业界视为“电子仓库”;如今随着AI智能体开始自主调用工具、执行复杂逻辑任务,数据中心正全面转变为持续吞吐海量数据并输出智能内容的“token工厂”。
业内普遍认为,无论是所谓“token工厂”还是AI工厂,其实质就是把数据中心重新定义成智能产线:输入是电力、数据、模型和调度系统,输出则是AI智能体的执行能力和行业场景中的实际生产率。
每瓦特token,定义AI时代的“生死线”
黄仁勋在演讲中将token比作数字经济时代的“硬通货”,认为在既定的电力和空间资源约束下,数据中心产出token的速度、质量和成本,将直接决定科技企业能否存活,因此每瓦特电力的token吞吐量将替代传统的“服务器数量”“存储容量”成为决定数据中心竞争力与营收的核心指标。
在未来的AI服务体系中,token成为可计价的数字商品,AI服务按吞吐量、速率、智能密度等为它分层定价。免费层级的token吸引更多客户,而高端层级的token服务于最有价值的客户。
相关观点已经得到业内广泛认同。知名风险投资机构红杉资本公司在一份行业观察报告中指出,GPU计算正日益商品化,充裕且低成本的算力已成为支撑数字经济运转的基础设施。美国斯坦福大学发布的2025年人工智能指数报告显示,得益于小型模型的能力跃升,执行GPT-3.5级别系统的推理成本在2022年11月至2024年10月间骤降280多倍。
黄仁勋在演讲中说,随着模型越来越大、上下文越来越长,AI会变得更“聪明”,但token的生成速率会降低,因此架构优化至关重要。在GTC大会上,英伟达宣布将推出新一代AI计算平台“薇拉·鲁宾”,每瓦特性能预计将达到上一代系统的10倍。英伟达同时展示了可容纳256个语言处理单元(LPU)的配套机架系统,该系统与“薇拉·鲁宾”平台协同工作,可将每瓦特词元生成效率提升约35倍。
全球加紧算力布局
全球半导体供应链与云服务商的研发焦点,正全面转向提高单位瓦特下的词元产出率,核心目标都是在有限的能源供给下,让算力设施产出更多的“硬通货”。
除了电力供应,AI产业还面临物理空间、冷却水资源等多重约束。在此背景下,能源瓶颈促使全球算力布局加速与绿色转型深度融合。一段时间以来,全球大型科技企业正密集地向核电、地热等清洁能源领域延伸投资。
2025年6月,美国亚马逊公司与塔伦能源公司宣布达成长期协议,将从塔伦能源旗下的萨斯奎汉纳核电站获得1920兆瓦电力供应,以用于亚马逊云科技公司的数据中心,双方还在考虑合作建造小型模块化反应堆和为核电站扩容。同年10月,谷歌公司公布一项计划,将重启位于美国艾奥瓦州一座核电站,为其AI基础设施供电。
面对“token工厂”带来的产业重塑,许多经济体已认识到,掌握算力意味着掌握数字经济的定价权与数据安全的主动权。
从欧洲到中东,许多国家正斥巨资建立本土数据中心,以确保其AI模型能够基于本国语言、文化和价值观进行训练和内容生成,避免在数字经济底层基础设施上过度依赖跨国巨头。根据德国政府本月17日公布的一项数据中心扩容战略规划,到2030年,德国通用数据中心的算力将在2025年基础上至少翻一番。新增的数据中心容量将优先由德国和欧洲企业建设,以减少德国对欧洲以外大型云服务提供商的依赖。(完)
热门跟贴