词元经济研究丨钟新龙：Token经济学概念研究及启示建议|token|推理|经济学|钟新龙

编者按

词元经济正在打开经济学中长期被视为“黑箱”的技术进步过程，使知识参与价值创造的方式首次变得可观测、可计量。当前，围绕词元经济涌现的一系列新问题，呼唤理论研究的前瞻回应。自本报有关词元经济研究系列报道及征稿启事发布后，我们得到广大读者的积极回应，已经收到大量高质量来稿。稿件研究视角多元，反映出词元经济作为智能经济新形态的核心议题，已引起学术界与产业界的广泛关注。鉴于报纸版面容量有限，同时为增强研究成果发布的时效性，中国经济时报在微信公众号推出“词元经济研究”栏目，选登部分优秀来稿及后续系列文章，旨在汇聚各方智慧，为智能时代的产业实践与政策治理提供分析框架与决策参考。敬请关注！

征稿持续进行中，投稿邮箱：892720943@qq.com。期待您的真知灼见。

图片来源/摄图网

Token经济学概念研究及启示建议

——人工智能竞争从拼算力转为拼价值

■钟新龙

近期，围绕“智能Token是新的货币”“AI工厂是Token工厂”的讨论迅速升温。2026年3月16日，英伟达首席执行官黄仁勋明确提出“智能Token是新的货币”；3月18日，他又提出将“算力—Token—智能—经济产出”连成一条链。Token经济学由此从技术计量概念转向产业核算概念。研究认为，Token已成为连接算力、模型、场景和收入的中间计量单位，但不能把Token数量直接等同于真实价值。下一阶段竞争将从拼算力规模，转向拼单位功率Token产出、单位Token质量和单位场景兑现能力。

Token经济学已成为人工智能产业的新核算语言

Token已从模型内部计量单位上升为人工智能产业的核算语言。2026年3月16日，英伟达在GTC期间发布Vera Rubin DSX AI Factory参考设计，黄仁勋称“智能Token是新的货币”，AI工厂是生产这种“货币”的基础设施，并将“加快首笔收入实现时间”与“最大化Token每瓦”并列提出。3月18日，他在摩根士丹利技术、媒体与通信会议上进一步将“算力等于Token，Token等于智能，智能等于经济产出”串联起来，并明确提出单位功率Token产出是关系企业营收增长的首要指标。企业领导层开始用Token而不是单纯参数量、算力卡数或模型排名讨论AI投入产出，说明产业评价口径正在变化。

Token经济学升温的直接背景是推理需求和代理任务正在快速放大Token消耗。据德勤2026年1月21日发布的《State of AI in the Enterprise》新闻稿，85%的企业计划按自身业务需要定制智能体，25%的受访企业已将40%以上AI试点转入生产，54%预计在未来3至6个月达到同一水平。Gartner 2026年1月15日预测，全球AI支出2026年将达2.52万亿美元，同比增长44%，其中AI基础设施将新增4010亿美元支出，AI优化服务器支出增长49%。任务型智能体替代单轮问答后，Token消耗与推理频次同步放大，算力投资正在从训练导向加快转向推理导向。

现有讨论仍普遍把Token看成可直接定价的统一商品，容易低估真实价值差异。德勤2026年1月19日发布《AI tokens:How to navigate AI’s new spend dynamics》明确指出，AI正在进入由不可预测、基于Token的成本驱动的新经济系统，传统总拥有成本模型已不足以管理AI支出。高德纳咨询公司（Gartner）2026年3月25日又预测，到2030年，对1万亿参数大模型进行推理的成本较2025年将下降90%以上，早期同类模型的成本效率最多可提高100倍。成本快速下行意味着，未来真正稀缺的未必是Token数量本身，而是高质量Token和高价值场景的兑现能力。

Token经济学的关键在于构建从算力到价值的五级转化链

Token经济学应以“价值Token”而不是“原始Token”为核心核算对象。可将其概括为“五级转化链”：算力供给、工厂转化率、模型效率率、质量调整系数、场景兑现率。前两级回答“能生成多少Token”，中间一级回答“每个Token要付出多大成本”，后两级回答“Token能否形成可信结果并转化为收入、效率和治理能力”。按照这一路径，Token只是中间单位，不是终点单位。相同电力、相同卡数、相同Token吞吐，仍可能因为系统工程、模型设计、可靠性和业务嵌入深度不同，形成完全不同的经济结果。所提出的四点判断基本成立，缺的关键一环是“场景兑现率”。

算力异质性和AI工厂转化率决定了Token产出的上限。2026年3月25日，英伟达技术博客指出，在AI时代，电力是硬约束，性能每瓦是现代AI基础设施的定义性指标，其六代架构的每兆瓦推理吞吐提升了100万倍。同一篇文章还指出，在吉瓦级AI工厂中，最多可有40%的电力在到达有效计算之前损失于冷却和过度预留；采用DSX Max-Q后，500兆瓦AI工厂在同等电力包络下可多部署30%的GPU。学术界近一个月的研究也在重复同一结论。2026年3月23日发表于《Pattern Recognition》的论文指出，异构负载下不合理调度会造成明显队首阻塞，直接压低系统效率。说明同样的电力和芯片，经由不同网络、冷却、调度和软件栈，转化出的Token并不相同。

模型效率决定了同一工厂中每个Token的成本曲线。英伟达2026年2月财报新闻稿中，黄仁勋称Grace Blackwell with NVLink在推理侧已实现“数量级更低的每Token成本”；Gartner 2026年3月25日则预计，到2030年，1万亿参数大模型推理成本将比2025年下降90%以上。更重要的是，近期学术文献表明，降本并不只来自硬件迭代。2026年3月发表于国际学术期刊《环境科学与生态技术》（Environmental Science and Ecotechnology）的论文指出，优化提示词可将生成式AI推理能耗和碳排放降低32%至48%；2026年3月19日发表于《下一代计算机系统》（Future Generation Computer Systems）的论文则从推理引擎优化角度提出自动化管线以降低推理能耗。相同算力、相同模型类别，在量化、调度、缓存复用和提示设计不同条件下，单位Token成本会出现显著分化。

输出质量和场景兑现率决定了Token能否真正变成价值。同样100万Token，低质量输出只能形成二次返工和幻觉风险，高质量输出却可能直接形成代码、审计线索、工业参数、知识服务和公共治理建议。德勤2026年1月21日指出，尽管近四分之三企业计划在两年内部署智能体，但仅21%建立了成熟的智能体治理体系；1月14日，汤森路透联合Anthropic、Google Cloud、OpenAI等发起可信人工智能联盟（Trust in AI Alliance），明确将可靠性、可解释性和验证能力视为高风险专业场景部署前提。由此看，真正应纳入核算的不是“总Token”，而是“可验证、可交付、可落地”的价值Token。

我国应尽快建立面向价值兑现的产业体系

应尽快建立以价值Token为核心的产业评价口径。当前政策和产业观察更多统计算力规模、模型参数、备案数量和应用案例，尚缺少贯通“电力—Token—价值”的统一指标。建议在重点地区和重点行业先行建立四类指标：单位功率Token产出、单位Token成本、任务成功率与人工替代率、价值兑现周期。对于政务服务、工业制造、金融合规、医疗辅助等高价值场景，应进一步引入可信度、可审计性、人工复核率等质量指标，把“能跑起来”与“能产出价值”区分开来。

应把AI工厂作为系统工程推进，而不是把竞争理解为单点芯片竞赛。黄仁勋2026年3月以来连续强调，AI工厂受制于电力、冷却、网络、软件和模型协同，单位功率Token产出才是企业和国家层面的关键指标。对我国而言，要把国产人工智能基础设施建设从“单卡性能比拼”转向“系统级最优”，同步推进服务器、互连网络、液冷、调度软件、推理框架和行业模型协同适配。围绕东数西算、算电协同、智算中心更新改造和重点行业私有化部署，可优先支持能够显著提升Token转化率的系统工程项目。

应把高价值场景落地和治理能力建设放在同等重要位置。Token经济学最终考验的不是谁消耗Token更多，而是谁能把有限Token稳定转成真实生产力和公共价值。建议围绕“高频、刚需、可验证、可留痕”四个标准遴选重点场景，在工业、政务、法律、科研、医疗和供应链等领域形成可量化示范工程，并同步建设智能体治理、模型评测、责任追溯和成本监控体系，防止把Token消费误当成价值创造。

(作者系中国电子信息产业发展研究院未来产业研究中心人工智能研究室主任)

总监制丨王列军车海刚

监制丨陈波王彧杨玉洋

主编丨毛晶慧编辑丨蒋帅

词元经济研究丨钟新龙：Token经济学概念研究及启示建议

热搜

热门跟贴