上世纪八九十年代,诺贝尔经济学奖得主罗伯特·索洛(Robert Solow)曾留下一句著名的调侃:“计算机时代随处可见,唯独在生产率统计中看不到显著提升。”
当年,经济学家们面对着随处可见的个人电脑,却在宏观数据中找不到经济腾飞的证据。直到多年以后,统计方法的修正才让人们在回溯数据时,看到了计算机革命带来的庞大增长。仅 2013 年一次 GDP 核算方法修订,就把上世纪 90 年代的产出往上调了约 3.6 万亿美元,相当于 2000 年全年 GDP 的近 30%。
如今,AI 正在重演甚至放大这一现象。
最近,知名半导体与 AI 产业链分析机构 SemiAnalysis 发布了一篇题为“AI Dark Output: The Visible Cost of Invisible Output”的文章,直指当前经济统计体系面临的一个重大问题:既然 AI 花了这么多钱(算力、电力),为什么我们在经济数据(GDP、生产力报告)上还看不到对应的回报?
文章指出,并非 AI 没有创造价值,而是人类沿用了上百年的宏观经济测量标尺,已经无法衡量 AI 创造的真实财富。因为这一次,AI 创造的新产出绝大多数集中在服务业,而服务业的产出恰恰是最难量化的。
文章作者 Malcolm Spittler 是 SemiAnalysis 的宏观经济负责人,他曾在花旗集团担任美国经济学家和全球策略师近 20 年;另一位是 SemiAnalysis 的创始人、首席执行官兼首席分析师 Dylan Patel。
暗产出的三种形态
为了精准定义这种现象,报告借用了宇宙学中的概念,提出了“暗产出”(Dark Output),就像在宇宙中占据主导地位却无法被直接观测的暗能量一样,暗产出指的是 AI 创造的经济价值真实存在,但在 GDP、物价指数、就业统计或国民经济核算中却不可见。
作者把 AI 暗产出分为了三类。
第一类是替代型暗产出(Substitution Dark Output),即 AI 取代了人类以前做的工作。报告显示,当前约有 1.5 万亿美元的人工任务,已经被当前这一代 AI 大幅赋能或彻底自动化。
比如法律文书起草。过去,律师起草一份遗嘱收费 150 美元,计入 150 美元 GDP;现在,AI 生成同样质量的遗嘱只需消耗 0.5 美元的算力。对用户而言价值分毫未减,但在国家的宏观账本上,这项经济活动却直接缩水了 99%。
第二类是新增性暗产出(New Dark Output),即由 AI 执行的全新劳动。这类工作过去因为人工成本过于高昂而无人问津,直到 AI 将其成本降到足够低时才得以大量涌现。报告指出,长期来看,这才是 AI 经济中最庞大的一块。
比如,当一份调研报告的成本从 2,000 美元跌至 2 美元时,我们并不会为了省钱而只保持原有的研究数量。相反,我们会在启动每一个项目前都做一份详尽的调研报告;我们还会让 AI 帮忙总结收件箱里过去半年内关于某个特定主题的所有邮件;在参加一场面试前用 AI 极速生成一份参考内容。
这些事情都极具价值,会让人们的决策更加精准。但在宏观经济层面上,它们没有顶替任何现有的岗位,也不会产生大额的交易流水。它们仅仅表现为云服务商账单上几美分的 Token 消耗。
第三类是被捕获的 AI 产出 (Captured AI Output),指的是那些过去由人类执行、如今由 AI 接管,但依然能向客户收取与过去相同费用的工作。
这种情况通常发生在具有强大市场定价权的企业身上:即使 AI 让生产成本暴跌,企业依然能死守原价向客户收费。在这个逻辑下,如果公司用 1 万美元购买外部 AI 服务替代人力,GDP 基本不变;但如果内部员工用 10 美元的算力自己完成,GDP 却会减少 9,990 美元,尽管实际效用完全相同。
为什么服务业这么难统计?
为什么传统的宏观经济标尺在这场技术革命面前显得如此无能为力?根本原因在于,我们的经济核算体系,本质上是为工业革命和制造业量身定制的。
在制造业中,产出的衡量标准非常清晰。如果工厂里的机械师发明了一种新工具,使得螺丝钉的生产效率大幅提升,工厂的报表上会明确显示:用更低的成本,制造了数量更多的螺丝钉。过去几百年里,螺丝钉的价格下跌了 99%,但因为总产量成倍暴涨,经济学家可以清晰地计算出实际的经济增长和生产力飞跃。
然而,AI 产出的是“智力服务”,而人类至今没有发明出衡量脑力劳动的物理单位。工业时代有“马力”来对比蒸汽机与马匹的功率,但 AI 时代却没有“智力马力”来对比大模型与人类大脑的产出。
目前唯一勉强能算作单位的是大模型消耗的 token 数量,但作者认为这完全是一个伪指标。同样消耗一百万个 token,它可能只是生成了一堆毫无逻辑的废话,也可能输出了一份拯救濒危企业的完美重组方案。经济价值是由内容的质量和场景决定的,而不是由 token 的数量决定的。拿着衡量成本的尺子,去衡量脑力智慧,宏观数据的失效也就成了必然。
如何确认 AI 暗产出的存在?
既然现有的经济体系无法直接统计量化,那我们如何确认这些“暗产出”是真实存在的?文章指出,可以通过捕捉一些反直觉的经济“怪象”来寻找 AI 的隐形产出。
第一,就业人数下降,但平均工资却在上升。在 AI 使用率高的行业或职业中,就业岗位相对整体经济在减少,但这些行业的平均工资却出现相对上升。原因在于,AI 首先替代的是初级、低薪、重复性强的岗位。当这些低薪员工从统计样本中消失后,剩下的主要是资深、高薪员工,从而拉高了平均工资数字。
第二,大量 token 用在计算机和数学等领域,但软件投资对 GDP 的贡献没有明显突破历史趋势。
根据 Anthropic 于 2026 年 3 月发布的数据,AI 的 token 使用中高达 37% 集中在计算机和数学相关任务上。这意味着大量 AI 算力被用于代码生成、数据分析、数学建模等高价值领域。然而,与此同时,美国软件投资对 GDP 的贡献却没有显著超过历史平均水平,甚至没有达到过往峰值。这种 token 消耗与宏观软件投资脱节的现象,暗示存在大量的“新增型暗产出”。
第三,初级岗位流失最快,而资深人员可能因效率提升获得更多机会。AI 目前对劳动力市场的影响呈现明显的层级差异。常规、入门级的工作被 AI 替代的速度最快,而中高层或需要复杂判断力的岗位,目前更多是被赋能而非完全被替代。结果就是底层员工数量减少最为明显,而资深专业人员因为工作效率大幅提高,能够处理更多复杂任务,反而可能获得更多发展机会。
此外,报告还系统性地总结了宏观统计数据在面对 AI 时,必然会遭遇的“四大黑洞”。
边界转移:外部采购的服务变成内部AI完成,交易消失,GDP 蒸发;价格崩溃:服务业靠“总花费除以单价”反推数量,当价格接近零,统计就会误判为行业萎缩;部门错配:医院用 AI 提高了诊疗效率,但收入记在软件供应商账上,导致采用 AI 的实体产业数据显得停滞不前;新工作隐形:几美分就能完成的战略推演,创造的巨大消费者盈余无处记录。
SemiAnalysis 因此建立了一套“证据阶梯”(Evidence Ladder),不再依赖滞后的大模型基准,而是基于真实市场信号,如公司声明、法院案例、保险公司承保来评估 AI 的影响。据他们测算,当前有高达 1.5 万亿美元的劳动力成本正暴露在 AI 强大的替代压力之下。
AI 正在成为社会的“全职主妇”
报告的最后,为了解释这种“有价值却无价格”的现象,两位作者引入了女性主义经济学的视角。
1988 年,学者 Marilyn Waring 曾愤怒地指出,起草初代国民核算体系的委员会中,91.7% 是男性。他们用一句话就抹杀了女性在抚养儿童、操劳家务、照顾老人病患方面的巨大贡献,认为这些对国民账户几乎毫无重要性。
国际劳工组织估算,全球每天有高达 164 亿小时的无偿照护工作在进行,如果按市价折算,价值高达 11 万亿美元,是全球科技产业总和的三倍。如果一个家庭花钱雇了保姆,这就是 GDP;如果妻子做了同样的打扫工作,这就对经济毫无贡献。
现行国民经济核算体系有一条铁律:没有金钱交易,就没有经济价值。今天,AI 正在经历与家庭主妇一模一样的命运。
报告指出,AI 使得几乎所有的信息处理任务都可被委托处理。大模型能够起草法律文书、分析财务报表、撰写营销方案、对患者投诉进行初步筛查、生成代码,或是撰写研究综述。在过去,上述每一项工作都是由带薪的人类员工完成的,并顺理成章地计入了 GDP。
如今,如果让 AI 帮忙记录一份医疗问诊笔记,这项劳动的经济痕迹,在国家的宏观账本上,只能体现在 AI 服务商开具的云端账单之中。
作者反复提醒,这并不是新问题。工业革命、计算机革命都曾面临统计量化难题。由于 AI 的成本清晰可见,而真实产出却隐匿于暗处,这极易导致市场将 AI 误判为只会烧钱的资本泡沫。因此,他们呼吁全社会不能只盯着 AI 造成的失业和成本消耗,必须尽快发明新的衡量工具,去精准捕捉、定价并量化 AI 正在产出的“隐形红利”。
正如美国联邦储备委员会主席 Kevin Warsh 所言:只看数据会落后,你得提前下注 AI 带来的增长潜力。
1.https://newsletter.semianalysis.com/p/ai-dark-output-the-visible-cost-of
运营/排版:何晨龙
注:封面/首图由 AI 辅助生成
热门跟贴