OpenAI正在优先发展ChatGPT,而非长期研究工作,这一战略调整导致多位资深员工离职。这家估值500亿美元的公司面临来自谷歌和Anthropic等竞争对手的强大压力。
根据10名现任和前任员工的说法,OpenAI已将资源从实验性工作重新分配到推进其旗舰聊天机器人所依赖的大语言模型。
在近几个月因战略调整而离职的员工包括研究副总裁杰里·特沃雷克、模型政策研究员安德烈亚·瓦洛内和经济学家汤姆·坎宁安。
这些变化标志着OpenAI从研究实验室向硅谷最大公司之一转变的重要时刻。ChatGPT在2022年从研究预览版脱颖而出,引燃了生成式AI热潮。在首席执行官萨姆·奥特曼的领导下,OpenAI必须向投资者证明其能够获得足够收入来证明500亿美元的估值合理性。
一名熟悉OpenAI研究雄心的人士表示,OpenAI正将大语言模型视为工程问题,通过扩大计算规模、扩展算法和数据来取得巨大成果。但如果想进行原创性基础研究,这会非常困难。如果你不在中心团队之一,它会变得越来越具有政治色彩。
OpenAI首席研究官马克·陈反驳了这一说法。他表示,长期基础研究仍然是OpenAI的核心,持续占据其计算和投资的大部分,有数百个自下而上的项目在探索超越任何单一产品的长期问题。陈补充道,将这项研究与实际部署相结合能够通过加速反馈和学习循环来强化科学严谨性,公司对实现自动化研究员的长期研究路线图更有信心。
与其他大型科技公司一样,OpenAI的研究人员需要向高管申请计算"配额"和技术访问权限来启动项目。多位知情人士表示,在过去几个月里,非大语言模型领域的研究人员的申请经常被拒绝,或获得的配额不足以验证其研究。
从事视频和图像生成模型Sora和DALL-E的团队感到被忽视和资源不足,因为他们的项目被认为与ChatGPT相关性较低。在过去一年中,其他与大语言模型无关的项目也已被逐步关闭。有人还表示,公司进行了团队重组,OpenAI围绕改进被8亿人使用的热门聊天机器人来优化其结构。
去年12月,奥特曼宣布对改进ChatGPT的需求发出"红色警报"。这是在谷歌发布Gemini 3模型之后,该模型在独立基准测试中表现优于OpenAI,而Anthropic的Claude模型在生成计算机代码方面也取得进展。
一名前员工表示,现实上存在巨大的竞争压力,尤其是对于想要每个季度都拥有最佳模型的扩展型公司而言。这是一场疯狂的残酷竞争,公司在这场竞争中投入了令人难以置信的资金,这通常需要专注力和坚持自己擅长的做法。
另一位前资深员工补充说,理论上存在进行其他类型研究的意愿,但为这些工作分配资源变得非常困难,所以你总是觉得自己是相对于主要押注的二等公民。
今年1月,领导AI模型"推理"工作的特沃雷克在OpenAI工作七年后离职,表示想要探索"在OpenAI很难进行的研究类型"。他希望从事持续学习工作,即模型学习新数据同时保留先前学到信息的能力。
熟悉特沃雷克的人士表示,他对计算能力和人员等更多资源的申请遭到领导层拒绝,最终与首席科学家雅各布·帕霍斯基产生对立。
熟悉这一分歧的人士表示,帕霍斯基不同意特沃雷克的具体科学方法,并相信OpenAI围绕大语言模型的现有AI架构更有前景。
上月,领导OpenAI模型政策研究的瓦洛内加入竞争对手Anthropic。两名熟悉其离职的人士表示,她被赋予了一项"不可能"完成的使命——保护正在对ChatGPT产生依恋的用户的心理健康。瓦洛内未回应置评请求。
坎宁安于去年离开经济研究团队,暗示OpenAI正在偏离公正研究,转而专注于推进公司利益的工作。他的离职首次由《连线》报道。
一名前员工表示,该公司仍在取得进展,但陷入了与谷歌和Anthropic的激烈竞争,这两家公司拥有共识更强的模型,因此他们减速的空间较小,否则可能被竞争对手超越。
许多投资者并不担心OpenAI在构建先进"前沿"模型和产品竞争中落后的风险。
Leonis Capital合伙人、OpenAI前研究员詹妮·肖认为,OpenAI的优势在于数亿使用ChatGPT的人。
她表示,每个人都在执着于OpenAI是否拥有最佳模型,但这是错误的问题。他们正在将技术领导力转化为平台锁定效应。竞争优势已从研究转向用户行为,这是一个更具粘性的优势。
Q&A
Q1:OpenAI为什么优先发展ChatGPT而不是长期研究?
A:OpenAI面临来自谷歌和Anthropic的激烈竞争,需要向投资者证明其500亿美元估值的合理性。公司正在将资源从实验性工作重新分配到大语言模型开发,以保持竞争优势。同时,谷歌Gemini 3模型的优异表现和Anthropic Claude的进展加大了竞争压力。
Q2:哪些资深研究人员因资源分配问题离职?
A:研究副总裁杰里·特沃雷克因持续学习研究的资源申请被拒而离职;模型政策研究员安德烈亚·瓦洛内因被赋予"不可能"完成的任务而加入Anthropic;经济学家汤姆·坎宁安离职是因为公司偏离公正研究转向推进公司利益。
Q3:被冷落的研究项目有哪些?
A:Sora和DALL-E等视频和图像生成模型团队感到被忽视和资源不足,因为这些项目被认为与ChatGPT相关性较低。其他与大语言模型无关的项目也在过去一年被逐步关闭。
热门跟贴