TALK

听了一场 OpenAI 的内部讨论,主题是 AI 怎么改变劳动力市场。四位参与者:

Ronnie ChatterjiOpenAI 首席经济学家,Duke 商学院教授,拜登政府时期担任过商务部首席经济学家和白宫 CHIPS 协调员

Alex Martin RichmondOpenAI 经济研究团队的劳动经济学家,MIT 博士,之前在 Burning Glass Institute 做劳动力市场研究

Daniel Rock沃顿商学院助理教授,AI 经济学研究者,Workhelix 联合创始人,MIT 博士

Gregor SchubertUCLA Anderson 金融学助理教授,做 AI 对劳动力和企业影响的实证研究

四位都是在数据里摸爬滚打的经济学家

以下是我听完之后比较重要的几个点

Solow 悖论重演了

Daniel 开场第一句话就把 Bob Solow 1987 年那句经典的话搬了出来:「你到处看得见电脑,就是在生产率统计里看不见」

他说现在 AI 也是这样

他用一个叫「生产率 J 曲线」的框架来解释。他和 Erik Brynjolfsson、Chad Syverson 几年前一起写过一篇论文专门讨论过。大意是,一项通用技术从出现到真正改变经济数据,中间有一段很长的 J 型曲线

前半段,企业要投钱投人在一些摸不着的地方,新流程、新文化、新组织结构、新车间。这些投入从外面看是成本,从内部看是未来的产出

等到这些地基搭好,生产率才会真正跳上去

Solow 当年看到的是电脑,现在看到的是 AI,规律没变

Gregor 补了一个数据视角。现有研究用两个维度衡量企业对 AI 的使用,一是潜力(这家公司或这个岗位有没有用 AI 的空间),二是落地(实际用起来了没)。两者之间的落差很大。他自己的研究发现,原本技术能力强的企业落地更快,剩下的大多数还在搭内部的脚手架

Alex 把这个现象落到她自己身上。她 2024 年 12 月加入 OpenAI,到现在半年多,写代码、做数据分析、设计实验的方式跟入职时完全不同。她现在的很多分析是 CodeX 在写,她负责定义问题和验收结果。但这些变化对外面的统计局来说,看不见

AI 做的是中间到中间

这是 Gregor 讲到的一个表述,整场讨论里最值钱的一句话

所谓端到端,是一个任务从头到尾交给 AI,人完全不参与。这是大部分人想象中的 AI 替代场景

中间到中间 是说,AI 接管的是一个任务的中段,前后还需要人。前面要有人把任务设计清楚、把数据整理好、把提示词写对。后面要有人验收、做安全检查、把输出接到下游

Alex 用自己的例子解释。她让 CodeX 去跑一个分析,CodeX 返回结果之后,她要花时间验证这个结果是不是对的,再交给 Ronnie。验证这件事本身是一个新任务,以前没有

这就带来一个测量上的尴尬。你看到 AI 好像自动化了一些东西,但同时也创造了新任务。很难说清楚某一个岗位到底是被替代了还是被增强了

Gregor 把这个观察推到组织结构层面。他说现在企业内部正在出现一些新角色:

→ 把内部数据整理成 AI 能吃的格式的人

→ 设计任务输入、调提示词的人

→ 验收和评估 AI 输出的人

这些角色以前没有。现在每家想认真用 AI 的公司,都在临时拼凑这些角色

Daniel 补了一个案例。他最近跟一家韩国银行的 CEO 聊,对方把 AI 工作流的设计权下放给业务专家,让懂业务的人设计流程,IT 部门的作用变成给他们搭可靠、可维护、安全的底座

这里 Daniel 讲了一段工厂电力的历史。工厂早期用中央蒸汽机,一台大机器通过皮带驱动所有设备。后来电力普及,最早的做法是把蒸汽机换成大电机,继续用皮带。真正的效率革命发生在几十年后,工厂把每台设备配一个小马达,整个车间重新排布

AI 现在在走同一条路。过去技术能力集中在 IT 部门,未来技术能力要下沉到每一个具体业务人员手里

家里的 AI 比公司的 AI 还多

Gregor 拿出了他和 Michael Blank、Ben Zhang 的一项研究,里面有一个数字:使用聊天机器人做家庭事务的人数,超过了使用聊天机器人做工作事务的人数

现在 AI 最大的一块使用场景不在企业里,在厨房、在沙发上、在手机屏幕上

人们用 AI 规划旅行、查医疗问题、做购物清单、写家长会发言稿、帮孩子做作业、挑餐厅。这些活动都在创造实际价值,但不会进 GDP,因为这些本来就不是市场交易

Alex 给了一个 OpenAI 内部的数据:消费级 ChatGPT 的使用中,大约有 30% 带有工作相关的信号。工作和生活之间的边界本来就不清楚,很多人用自己的个人账号处理工作任务

她接着说了一段很坦诚的话。美国现在缺乏好的行政数据来追踪职业级别的 AI 影响。不像欧洲一些国家有完整的税务和工资链接,美国只能靠小样本调查去推断。研究者想把消费端的 AI 使用和宏观生产率对起来,数据基础都不够

产出已经在家里了,GDP 还没赶上来

咨询业的小反讽

Gregor 讲到这里插了一段他自己的经历。他本科毕业后在 BCG 做过咨询。咨询公司招新人的时候总是讲「你来了会解决大的战略问题」。实际情况是,新人前两年主要做 PPT、记会议纪要、整理表格

AI 最擅长的是什么?做 PPT、记会议纪要、整理表格

他的观察是,如果这些事被 AI 接走,咨询公司当年那个「你来解决大战略问题」的承诺,反而可能终于兑现

个人生活里也是同一件事。你不想花三个小时读论坛去查一个药物反应,不想花两个下午填七份一样的申请表。把这些事压缩掉之后,你真正愿意花时间的那些事的权重就上来了

MBA 五周才能上手,普通劳动力要更久

Gregor 教一门面向 MBA 学生的 AI 应用课,一学期五周。就算是研究生水平、智商在线、预算充足的 MBA 学生,五周的课程只够让他们达到「自己觉得能用 AI」的水平

他由此往外推。大部分劳动力没有 MBA 的知识基础,也没有那么多连续的学习时间。要让一个普通员工达到同样水平,大概率需要 十到二十周

光发模型使用权是不够的,真正的障碍是训练时间。如果社会希望 AI 的红利被更多人享受,公共投资在培训上的那一块是跑不掉的。不然会出现很典型的马太效应:有基础、有时间、有渠道的人用上前沿模型,其他人连「好东西长什么样」都不知道

Daniel 补了一个视角。他以前做过场外期权交易,他说在高不确定性的环境下,政策应该按「期权」的逻辑去做:搞一堆小规模实验,其中哪个看上去能用,再把它规模化。不要一上来就押一个大而全的方案

Alex 提了一个容易被忽略的观察。美国现有的失业保险制度其实是为这类转型设计的。一个人从 A 公司被裁到去 B 公司之前有段空窗期,UI 就是为了托这段空窗

AI 带来的转型可能让这段空窗期变长、让跳跃的距离变远,但底层的机制是对的。要做的事是调参:延长领取时间、加大金额、配套再培训。不需要推倒重来

能力悬置

Alex 讲到一个概念叫「能力悬置」(capability overhang),这是这场分享里第三个值钱的表述

意思是,模型的能力已经到了某个水平,但大多数用户的使用方式还停留在六个月甚至一年前

她和 Ronnie 都说,他们在 OpenAI 内部能明显看到这种落差。团队里的 power user 用 CodeX 的方式已经和普通人差出两个身位。这种差距可以通过同事之间的扩散快速缩小,也可能因为缺乏正确的示范而长期存在

对一个企业来说,如果团队里有一两个 power user,最值钱的事是让他们把别人带起来。仅仅庆祝一个人产出翻倍,不够

对个人来说,如果你用 AI 的方式已经两个月没有变了,大概率已经落在能力悬置的后半段

现在最大的生产率空间,在于让已经在用 AI 的人用得更好

要学什么

最后一个问题来自观众:给要进大学的年轻人什么建议,让他们学什么

Daniel 先打了个圆场,说 AI 和经济学都不错。接着他讲真正重要的是解决问题的能力。工程和科学会一直有用,因为它们本质上是在和还没解决的问题打交道。人文学科也一直有用,因为 AI 改变社会这件事需要人去解释

Gregor 给了一个更实操的回答。学科本身不会贬值,贬值的是学科内部某些具体的任务。做经济学,解题和推导的部分会贬值,提问题和找数据集的部分反而升值。做历史,手工翻档案会贬值,设计自动化档案分析的部分会升值

每个学科里面你要学的东西,都要往 判断、提问、能动性 那一头挪

一个观察

这一代 AI 的一个特点是,在消费端和企业端几乎同时变得好用。电力、铁路、互联网都是先在生产端扩散,再慢慢进入家庭。AI 反过来,消费端已经铺满,企业端还在搭梯子

一个后果是,普通人对 AI 能力的直觉领先于政策、领先于统计、领先于企业的组织结构。你在家里觉得 AI 已经很强,去公司发现它好像也就那样,再看政府统计数字,发现什么都没变

这种不一致,本身就是 Solow 悖论现代版的全部含义

生产率曲线会追上来的,但路径比想象的要长