2026年3月5日,Anthropic发布了一份题为《AI对劳动力市场的影响:一种新的测量方法与早期证据》的研究报告。这份报告的两位作者——经济学家Maxim Massenkoff和Peter McCrory——做了一件在AI话语圈里颇为罕见的事:他们没有预测未来,而是老老实实地去测量现在。
报告的核心工作,是建立一套名为"观测暴露度"(Observed Exposure)的新指标——将AI的理论能力与来自Claude真实使用数据相结合,尝试回答一个此前从未被严格回答过的问题:AI到底在多大程度上真正进入了职场?而他们得出的结论,既令人松了口气,又让人不安:目前为止,AI对就业的冲击几乎无法在数据中被测出——但对22至25岁的年轻求职者来说,某些门已经开始悄悄关上了。
这份报告发布时机微妙。距ChatGPT上线已过去三年有余,全球AI热度未退,而Anthropic自家CEO Dario Amodei此前曾多次公开警告,AI或将在五年内终结大量白领入门级工作。在这样的背景下,研究团队选择用数据说话,而不是用声量。
理论能力与现实使用之间,存在一道巨大的鸿沟
大多数关于AI替代就业的讨论,都建立在一个隐含假设上:AI能做到的,就等同于AI正在做到的。这个假设是错的。
研究团队使用了三套数据来拆解这个问题:O*NET数据库(覆盖约800种美国职业的任务清单)、Anthropic自身的Claude使用数据,以及2023年Eloundou等人发表的任务级暴露度估算(该研究衡量的是,理论上LLM能否将某项任务的完成速度提高一倍以上)。
理论上,AI能做什么?以计算机与数学类职业为例,LLM理论上可以覆盖其94%的任务;办公室行政类职业的理论覆盖率则高达90%。法律、商业与金融、管理类职业的理论覆盖率也同样可观。
但Claude实际在干什么?同样是计算机与数学类职业,Claude的实际任务覆盖率只有33%。
这个"理论能做"与"实际在做"之间的落差,构成了报告最重要的发现之一。研究者将两者的差距画成了一张雷达图:理论覆盖率(蓝色)像一片宽阔的叶片伸展开来,而实际覆盖率(红色)蜷缩在中心,只是前者的一小块。
为什么会有这样的差距?原因是多方面的:模型本身的局限、法律合规要求、系统集成的门槛、需要人工核验的环节,乃至组织内部的惰性。报告举了一个具体例子:Eloundou等人将"授权药物补充并向药房提供处方信息"这项任务标记为完全暴露(理论上LLM完全可以加速完成),但研究者在Claude的实际使用数据中,从未观测到这项任务的出现。
这个发现的意义在于:过去几乎所有关于AI就业冲击的预测,都是基于"理论能做"来推断替代风险,而真实的冲击,要等到那道"实际在做"的红色区域扩展到接近"理论能做"的蓝色区域时,才会真正到来。目前,我们还远未到那一步。
最高风险职业:程序员、客服、数据录入员
75%——这是目前观测到的暴露度最高的职业"计算机程序员"的任务覆盖率。换句话说,程序员日常工作中有四分之三的具体任务,已经在真实使用场景中被AI执行过。
排在其后的是客服代表(70.1%),驱动这一数字的是企业客服领域大量涌现的API自动化应用。数据录入员(67.1%)位列第三,其核心工作"读取源文件并将数据输入系统"在自动化场景中已相当普遍。
报告列出的前十大高风险职业还包括:医疗记录专员(66.7%)、市场研究与营销分析师(64.8%)、批发与制造业销售代表(62.8%)、金融与投资分析师(57.2%)、软件质量保证分析师与测试员(51.9%)、信息安全分析师(48.6%),以及计算机用户支持专员(46.8%)。
这份名单有一个明显的规律:排在最顶端的,不是那些需要最复杂判断力的知识工作,而是那些在知识工作的光环下,实际包含了大量可标准化、可重复执行任务的角色。客服、数据录入、质量测试——这些职业的共同特点是:任务边界清晰,输入输出可预期,对话或操作流程相对固定。
相比之下,有30%的劳动者的职业暴露度为零——他们的工作任务在Claude的使用数据中出现频率太低,甚至连最低阈值都无法达到。厨师、摩托车修理工、救生员、酒保、洗碗工——这些职业用人身体替代了大脑,AI在短期内完全无从渗透。
受AI威胁最大的,是受过良好教育的高薪女性
这个结论,和大多数人的直觉相反。
研究团队使用了ChatGPT发布前三个月(2022年8至10月)的美国现住人口调查(Current Population Survey)数据,对比了高暴露度群体(观测暴露度前四分之一)与零暴露度群体(暴露度为零的30%劳动者)的人口特征。
结果令人意外:暴露度最高的群体,比零暴露度群体的女性比例高出16个百分点(54.4% vs 38.8%)。她们更可能是白人,且几乎是亚裔比例的两倍。她们的平均时薪高出47%(32.69美元 vs 22.23美元)。她们受过更高的教育:拥有研究生学历的人在高暴露群体中占17.4%,在零暴露群体中仅为4.5%——差距近四倍。
这揭示了一个结构性现实:AI目前入侵的,恰恰是那些依靠文字、数字、逻辑推演为生的"知识密集型"岗位。而这类岗位在历史上,正是受过良好教育的女性突破性别障碍之后大量进入的领域——金融分析、法律研究、医疗记录、市场营销。
这并不意味着AI是一种针对女性的技术。更准确的表述是:AI攻克的第一批工作,是那些在数字经济中蓬勃生长、吸引了大量知识阶层的岗位——而这些岗位的人口结构,恰好就是如此。
失业率:至今没有可测出的信号
这是整份报告最反直觉、也最重要的发现。
研究团队将职业级的暴露度数据与现住人口调查对接,观察自2016年以来,高暴露度劳动者的失业率走势,并将其与零暴露度劳动者进行了"差中差"(Difference-in-Differences)对比。
结论非常清晰:在ChatGPT发布以来的时间段内,高暴露度群体的失业率相对于低暴露度群体的变化,统计上与零无异。ChatGPT发布后的平均系数为+0.0020,标准误为0.0019——差不多就是在测量噪声。
研究者做了不少稳健性检验:变换暴露度的截断阈值(从中位数到第95百分位),结论一致;换用美国劳工部的失业保险申领数据代替问卷调查,结论一致;单独看22至25岁年轻劳动者,失业率同样没有显著上升。
这并不意味着AI没有任何影响。更合理的解读是:目前AI渗透的深度,还不足以触发大规模失业。就像研究者在报告中给出的情景推演:如果高暴露度群体的失业率从3%上升到6%——相当于2008年金融危机期间美国整体失业率翻倍的幅度——他们的框架完全可以测出这个信号。但这件事目前还没有发生。
他们还有一个更极端的情景推演:如果覆盖率前10%的职业劳动者全部被裁员,高暴露度群体的失业率会从3%飙升到43%,总体失业率会从4%上升到13%。这个数字的意义,不是预测,而是校准:它在告诉读者,这套框架的探测精度在哪里,以及如果灾难真的到来,我们是否能及时看见。
年轻人正在遇到一扇正在关闭的门
失业率数据没有发出警报,但有一个信号悄悄出现了。
研究者借助现住人口调查的面板数据,追踪了22至25岁的年轻劳动者进入不同暴露度职业的月度入职率——也就是,一个年轻人在某个月报告了上个月还没有的工作,这被计为一次"新入职"。
2024年开始,两条曲线开始分叉:进入低暴露度职业的年轻人月度入职率稳定在2%左右,而进入高暴露度职业的入职率下滑了约0.5个百分点。在ChatGPT发布后的整个区间内,高暴露度职业的入职率平均比2022年的基准水平下降了14%——这个数字刚好处于统计显著性的边缘(标准误为7.2)。
25岁以上的劳动者没有出现类似的趋势。
这个发现与Erik Brynjolfsson等人的研究结论相互印证。Brynjolfsson的团队利用ADP薪资数据发现,22至25岁的劳动者在AI暴露度高的职业中,就业规模下降了6%至16%,且原因主要是招聘放缓,而非离职增加。
问题的逻辑并不复杂:如果一家公司已经用AI处理了部分程序员的工作,他们可能不会裁掉现有员工,但会减少新的招聘名额。对在职者来说,感受可能不明显;对应届毕业生来说,这意味着投出的简历越来越难等到面试。
研究者对这一信号保持谨慎,给出了几种替代解释:年轻人可能选择留在原有工作、转向其他行业,或者重返校园。问卷调查对工作变动的测量也存在系统性误差。但无论如何,这是目前报告中唯一一个"至少在边缘上显著"的早期信号。
报告明确表示,这是他们计划持续更新的工作,而不是一次性发布。随着Claude使用数据的积累、Eloundou等人的理论暴露度指标随AI能力进化而更新,这套"观测暴露度"体系会不断迭代,提供一个动态的早期预警系统。
在他们看来,这套工具最有价值的时刻,恰恰是在效果"尚不明显"的时候——等到失业率数据已经发出警报,干预窗口可能已经过去。
报告:
https://www.anthropic.com/research/labor-market-impacts
END本文来自至顶AI实验室,一个专注于对AI计算机、工作站及各类AI相关硬件设备,开展基于真实使用场景评测的研究机构。
Q&A
Q1:什么是"观测暴露度",它和以往的AI替代风险指标有何不同?
以往的指标(如Eloundou等人2023年的研究)主要衡量的是"理论暴露度"——即LLM在理论上是否有能力加速完成某项任务,不考虑实际是否有人在这样用。Anthropic新引入的"观测暴露度"则结合了Claude的真实使用数据:一项任务必须在职场相关场景中被实际观测到有足够的AI使用量,且自动化比例越高、该任务在职业中占比越重,对应职业的观测暴露度就越高。两者最大的差距在于:理论上可以被AI覆盖的,和实际上正在被AI覆盖的,目前仍相差甚远。
Q2:目前的数据是否证明AI已经开始造成规模性失业?
没有。研究者将高暴露度职业(前四分之一)与零暴露度职业(后30%)的失业率进行了系统比较,发现自2022年底ChatGPT上线以来,两组的失业率差距没有发生统计上可辨识的变化。唯一出现边缘性信号的,是22至25岁年轻人进入高暴露度职业的入职率,在2024年开始小幅下滑约14%。但这一信号尚未达到强显著性水平,且存在多种替代解释。
Q3:哪类人群应当对AI的就业影响保持最高警惕?
从报告数据来看,有两类群体面临较高的结构性风险:一是从事高度可标准化知识任务的职业——客服代表、数据录入员、医疗记录专员、程序员;二是正在进入劳动力市场的年轻人,尤其是持有与AI高暴露度职业相关教育背景的应届毕业生。报告建议,未来的研究应当重点关注:拥有相关专业学历的新毕业生,是否已经在就业市场上遭遇了系统性的困难。
热门跟贴