AI正在创造万亿价值，但GDP里可能没算进去|token|国民|宇宙|马力

上世纪八九十年代，诺贝尔经济学奖得主罗伯特·索洛（Robert Solow）曾留下一句著名的调侃：“计算机时代随处可见，唯独在生产率统计中看不到显著提升。”

当年，经济学家们面对着随处可见的个人电脑，却在宏观数据中找不到经济腾飞的证据。直到多年以后，统计方法的修正才让人们在回溯数据时，看到了计算机革命带来的庞大增长。仅 2013 年一次 GDP 核算方法修订，就把上世纪 90 年代的产出往上调了约 3.6 万亿美元，相当于 2000 年全年 GDP 的近 30%。

如今，AI 正在重演甚至放大这一现象。

最近，知名半导体与 AI 产业链分析机构 SemiAnalysis 发布了一篇题为“AI Dark Output: The Visible Cost of Invisible Output”的文章，直指当前经济统计体系面临的一个重大问题：既然 AI 花了这么多钱（算力、电力），为什么我们在经济数据（GDP、生产力报告）上还看不到对应的回报？

文章指出，并非 AI 没有创造价值，而是人类沿用了上百年的宏观经济测量标尺，已经无法衡量 AI 创造的真实财富。因为这一次，AI 创造的新产出绝大多数集中在服务业，而服务业的产出恰恰是最难量化的。

文章作者 Malcolm Spittler 是 SemiAnalysis 的宏观经济负责人，他曾在花旗集团担任美国经济学家和全球策略师近 20 年；另一位是 SemiAnalysis 的创始人、首席执行官兼首席分析师 Dylan Patel。

暗产出的三种形态

为了精准定义这种现象，报告借用了宇宙学中的概念，提出了“暗产出”（Dark Output），就像在宇宙中占据主导地位却无法被直接观测的暗能量一样，暗产出指的是 AI 创造的经济价值真实存在，但在 GDP、物价指数、就业统计或国民经济核算中却不可见。

作者把 AI 暗产出分为了三类。

第一类是替代型暗产出（Substitution Dark Output），即 AI 取代了人类以前做的工作。报告显示，当前约有 1.5 万亿美元的人工任务，已经被当前这一代 AI 大幅赋能或彻底自动化。

比如法律文书起草。过去，律师起草一份遗嘱收费 150 美元，计入 150 美元 GDP；现在，AI 生成同样质量的遗嘱只需消耗 0.5 美元的算力。对用户而言价值分毫未减，但在国家的宏观账本上，这项经济活动却直接缩水了 99%。

第二类是新增性暗产出（New Dark Output），即由 AI 执行的全新劳动。这类工作过去因为人工成本过于高昂而无人问津，直到 AI 将其成本降到足够低时才得以大量涌现。报告指出，长期来看，这才是 AI 经济中最庞大的一块。

比如，当一份调研报告的成本从 2,000 美元跌至 2 美元时，我们并不会为了省钱而只保持原有的研究数量。相反，我们会在启动每一个项目前都做一份详尽的调研报告；我们还会让 AI 帮忙总结收件箱里过去半年内关于某个特定主题的所有邮件；在参加一场面试前用 AI 极速生成一份参考内容。

这些事情都极具价值，会让人们的决策更加精准。但在宏观经济层面上，它们没有顶替任何现有的岗位，也不会产生大额的交易流水。它们仅仅表现为云服务商账单上几美分的 Token 消耗。

第三类是被捕获的 AI 产出 (Captured AI Output)，指的是那些过去由人类执行、如今由 AI 接管，但依然能向客户收取与过去相同费用的工作。

这种情况通常发生在具有强大市场定价权的企业身上：即使 AI 让生产成本暴跌，企业依然能死守原价向客户收费。在这个逻辑下，如果公司用 1 万美元购买外部 AI 服务替代人力，GDP 基本不变；但如果内部员工用 10 美元的算力自己完成，GDP 却会减少 9,990 美元，尽管实际效用完全相同。

为什么服务业这么难统计？

为什么传统的宏观经济标尺在这场技术革命面前显得如此无能为力？根本原因在于，我们的经济核算体系，本质上是为工业革命和制造业量身定制的。

在制造业中，产出的衡量标准非常清晰。如果工厂里的机械师发明了一种新工具，使得螺丝钉的生产效率大幅提升，工厂的报表上会明确显示：用更低的成本，制造了数量更多的螺丝钉。过去几百年里，螺丝钉的价格下跌了 99%，但因为总产量成倍暴涨，经济学家可以清晰地计算出实际的经济增长和生产力飞跃。

然而，AI 产出的是“智力服务”，而人类至今没有发明出衡量脑力劳动的物理单位。工业时代有“马力”来对比蒸汽机与马匹的功率，但 AI 时代却没有“智力马力”来对比大模型与人类大脑的产出。

目前唯一勉强能算作单位的是大模型消耗的 token 数量，但作者认为这完全是一个伪指标。同样消耗一百万个 token，它可能只是生成了一堆毫无逻辑的废话，也可能输出了一份拯救濒危企业的完美重组方案。经济价值是由内容的质量和场景决定的，而不是由 token 的数量决定的。拿着衡量成本的尺子，去衡量脑力智慧，宏观数据的失效也就成了必然。

如何确认 AI 暗产出的存在？

既然现有的经济体系无法直接统计量化，那我们如何确认这些“暗产出”是真实存在的？文章指出，可以通过捕捉一些反直觉的经济“怪象”来寻找 AI 的隐形产出。

第一，就业人数下降，但平均工资却在上升。在 AI 使用率高的行业或职业中，就业岗位相对整体经济在减少，但这些行业的平均工资却出现相对上升。原因在于，AI 首先替代的是初级、低薪、重复性强的岗位。当这些低薪员工从统计样本中消失后，剩下的主要是资深、高薪员工，从而拉高了平均工资数字。

第二，大量 token 用在计算机和数学等领域，但软件投资对 GDP 的贡献没有明显突破历史趋势。

根据 Anthropic 于 2026 年 3 月发布的数据，AI 的 token 使用中高达 37% 集中在计算机和数学相关任务上。这意味着大量 AI 算力被用于代码生成、数据分析、数学建模等高价值领域。然而，与此同时，美国软件投资对 GDP 的贡献却没有显著超过历史平均水平，甚至没有达到过往峰值。这种 token 消耗与宏观软件投资脱节的现象，暗示存在大量的“新增型暗产出”。

第三，初级岗位流失最快，而资深人员可能因效率提升获得更多机会。AI 目前对劳动力市场的影响呈现明显的层级差异。常规、入门级的工作被 AI 替代的速度最快，而中高层或需要复杂判断力的岗位，目前更多是被赋能而非完全被替代。结果就是底层员工数量减少最为明显，而资深专业人员因为工作效率大幅提高，能够处理更多复杂任务，反而可能获得更多发展机会。

此外，报告还系统性地总结了宏观统计数据在面对 AI 时，必然会遭遇的“四大黑洞”。

边界转移：外部采购的服务变成内部AI完成，交易消失，GDP 蒸发；价格崩溃：服务业靠“总花费除以单价”反推数量，当价格接近零，统计就会误判为行业萎缩；部门错配：医院用 AI 提高了诊疗效率，但收入记在软件供应商账上，导致采用 AI 的实体产业数据显得停滞不前；新工作隐形：几美分就能完成的战略推演，创造的巨大消费者盈余无处记录。

SemiAnalysis 因此建立了一套“证据阶梯”（Evidence Ladder），不再依赖滞后的大模型基准，而是基于真实市场信号，如公司声明、法院案例、保险公司承保来评估 AI 的影响。据他们测算，当前有高达 1.5 万亿美元的劳动力成本正暴露在 AI 强大的替代压力之下。

AI 正在成为社会的“全职主妇”

报告的最后，为了解释这种“有价值却无价格”的现象，两位作者引入了女性主义经济学的视角。

1988 年，学者 Marilyn Waring 曾愤怒地指出，起草初代国民核算体系的委员会中，91.7% 是男性。他们用一句话就抹杀了女性在抚养儿童、操劳家务、照顾老人病患方面的巨大贡献，认为这些对国民账户几乎毫无重要性。

国际劳工组织估算，全球每天有高达 164 亿小时的无偿照护工作在进行，如果按市价折算，价值高达 11 万亿美元，是全球科技产业总和的三倍。如果一个家庭花钱雇了保姆，这就是 GDP；如果妻子做了同样的打扫工作，这就对经济毫无贡献。

现行国民经济核算体系有一条铁律：没有金钱交易，就没有经济价值。今天，AI 正在经历与家庭主妇一模一样的命运。

报告指出，AI 使得几乎所有的信息处理任务都可被委托处理。大模型能够起草法律文书、分析财务报表、撰写营销方案、对患者投诉进行初步筛查、生成代码，或是撰写研究综述。在过去，上述每一项工作都是由带薪的人类员工完成的，并顺理成章地计入了 GDP。

如今，如果让 AI 帮忙记录一份医疗问诊笔记，这项劳动的经济痕迹，在国家的宏观账本上，只能体现在 AI 服务商开具的云端账单之中。

作者反复提醒，这并不是新问题。工业革命、计算机革命都曾面临统计量化难题。由于 AI 的成本清晰可见，而真实产出却隐匿于暗处，这极易导致市场将 AI 误判为只会烧钱的资本泡沫。因此，他们呼吁全社会不能只盯着 AI 造成的失业和成本消耗，必须尽快发明新的衡量工具，去精准捕捉、定价并量化 AI 正在产出的“隐形红利”。

正如美国联邦储备委员会主席 Kevin Warsh 所言：只看数据会落后，你得提前下注 AI 带来的增长潜力。

1.https://newsletter.semianalysis.com/p/ai-dark-output-the-visible-cost-of

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成