衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

刚开年,OpenAI再出人事动荡:推理模型第一人离职了!

Jerry Tworek——构建o3、o1、GPT-4、ChatGPT以及 OpenAI首个AI编程模型Codex的关键人物,OpenAI研究副总裁——宣布了他的艰难决定

  • 离开OpenAI,去尝试探索一些在OpenAl难以开展的研究领域。

好奇,他所说的“在OpenAI难以开展的研究”包括哪些部分?

打开网易新闻 查看精彩图片

他表示,在OpenAI快七年的时间里,经历了许多美好和疯狂的时刻,但更多的是美好的时光。

(大佬也和OpenAI有七年之痒?)

不少OpenAI在职人员都在这篇推文上回顾了和Jerry共事的愉快经历。

也祝他拥有美好的未来。

打开网易新闻 查看精彩图片

网友看客们嘛,留言中的关键词主要是“感谢”和“赞叹”

打开网易新闻 查看精彩图片

依旧有因OpenAI流失重要人才感到沮丧的朋友。

打开网易新闻 查看精彩图片

但这条朋友的评论区更好笑。

打开网易新闻 查看精彩图片

很多人可能从Jerry断断续续的采访、演讲中认识他,了解得并不那么全面。

现在,让我们正经全方位认识一下这位推理模型大佬,以此送别,并祝愿他开启一个新的航程。

OpenAI推理模型第一人

OpenAI推理模型第一人

Jerry Tworek,出生、成长于波兰,在华沙大学数学专业取得硕士学位,属于强理论与数理功底出身。

打开网易新闻 查看精彩图片

他并不是一出校门就进入AI界打拼的

离开学校后的头五年,他先在阿姆斯特丹从事量化研究,主要研究期货市场的量化交易策略。

这期间,Jerry使用优化理论和从噪声数据集中提取信号的技术来研究和开发期货市场的量化交易策略,这最终引导他开始研究强化学习

2019年,Jerry加入OpenAI,担任研究科学家,主要方向是神经程序合成、强化学习等。

当时GPT‑2刚发布不久,OpenAI还以非营利研究实验室为主,规模小,名气不算大。

早期,他参与了机器人项目“用机器人手解决魔方”,并就这一项目在NeurIPS 2019深度强化学习研讨会作了展示。

Jerry也是最早一批参与“大规模预训练+算力扩展”路线的研究者之一,并且在前ChatGPT时期,他就已经展现出对模型推理的极大兴趣,

2020年GPT-3发布后,他开始着手研究评估和训练GPT-3以解决推理和逻辑问题。

截至今日,Jerry在各种公开演讲和访谈中,多次强调对“推理”而不仅仅是“模式匹配式生成”的重视,倾向把大模型看作可以通过训练“学会思考过程”的系统,而不仅是一个黑盒文本预测器。

打开网易新闻 查看精彩图片

2019–2022年间,他在OpenAI做神经程序综合与大模型推理研究,涉及Codex、Copilot这类代码大模型,同时利用强化学习提升复杂任务上的推理与决策能力。

2022年起,Jerry开始担任OpenAI的Research Lead,负责带团队研究“如何让大语言模型使用工具、解决STEM领域的困难问题”,包括插件和Code Interpreter等等。

ChatGPT出现之后,他逐渐被更多人认识——以ChatGPT和GPT系列模型主要贡献者之一的名义。

Jerry是GPT-4的首席研究员,领导了第一个推理模型o1的研究开发,对外被介绍为GPT-5推理机制和长思考能力的核心负责人。

还在各种各样的访谈、播客节目中系统讲解GPT-5的思考方式和推理模型的路线演化。

2025年,Jerry升任OpenAI研究副总裁。

2026年1月6日,Jerry宣布从OpenAI离职,并未公布具体去向。

打开网易新闻 查看精彩图片

下面附上Jerry离职小作文的翻译原文。

Jerry离职小作文写了什么?

Jerry离职小作文写了什么?

大家好,我做出了一个艰难的决定——离开OpenAl。

我在这里工作了将近七年,经历了许多美好和疯狂的时刻,但更多的是美好的时光。

我非常享受在这里工作的日子。我曾在机器人上进行强化学习的早期开发工作,还训练了世界上第一个编程模型,这些模型开启了大语言模型编程革命。

在DeepMind发布模型Chinchilla之前,我就发现了后来大家称为“Chinchilla Scaling Law”的现象。

我参与了GPT-4和ChatGPT的开发工作,最近还组建了一个团队,建立了一个新的缩放训练和推理计算范式——现在,它通常被称之为推理模型。

我结交了许多朋友,在办公室度过了许多个夜晚,参与并见证了数量可观的技术突破,还与许多被我视为亲密伙伴的人一同欢笑和担忧。

我有幸组建并壮大了我认为世界上最强的机器学习团队。

这是一段非常愉快的经历。尽管我要离开OpenAl去尝试探索一些在OpenAl难以开展的研究领域,但这是一家特殊的公司,也是世界上一个特殊的存在,它已然在人类历史的长河中占据了永恒的位置。

非常感激多年来OpenAI和你们对我的信任。这类时刻总让人感觉不太自然,但从积极乐观的角度看待,它们却可能成为促成伟大事物的催化剂。

我们一起让机器智能变得更加有用和可靠,我是忠实的ChatGPT推理模型用户。

再次感谢,感谢千千万万次。

保重身体,亲爱的草莓们。

Jerry

One More Thing

One More Thing

本来吧,附上Jerry的小作文,这篇推文就该结束了。

但被我翻到了一个粗看好笑,细想想又有点道理的留言:

打开网易新闻 查看精彩图片

仔细想想,OpenAI的朋友们离职时确实都有小作文,这是啥不成文规定吗?还是企业文化?

好奇.jpg

参考链接:
[1]https://x.com/MillionInt/status/2008237251751534622?s=20
[2]https://www.linkedin.com/in/jerry-tworek-b5b9aa56/
[3]https://warsaw.ai/speaker/jerry-tworek/