打开网易新闻 查看精彩图片

新智元报道

编辑:元宇 KingHZ

【新智元导读】微软CTO Kevin Scott的一封邮件揭开了OpenAI「波兰军团」的神秘面纱。

掌管OpenAI命运的,竟是6个波兰天才?

OpenAI首席科学家Jakub Pachocki,接替Ilya之后,完成了后者多年来求而不得的突破。

奥特曼甚至专门发了一篇短文,提到OpenAI两位不可或缺的人物:Jakub Pachocki和Szymon Sidor。

奥特曼认为他们两人是天作之合,「OpenAI还没有他们两人没法解决的问题」,没有他们俩就没有现在的OpenAI。

打开网易新闻 查看精彩图片

你可能不知道的是两人在波兰读高中就已经认识,而网友Teortaxes抛出一张OpenAI团队合影,波兰人浓度爆表──

打开网易新闻 查看精彩图片

OpenAI团队中六位顶级贡献者均为波兰人,从左到右分别为Jakub Pachocki、Łukasz Kaiser、Łukasz Kondraciuk、Szymon Sidor、Wojciech Zaremba、Jerry Tworek。

其中的Wojciech Zaremba,是OpenAI的十一位联合创始人之一。

在OpenAI成立之初,波兰工程师在团队中占据了相当大的比例,其中就有上面提到的Jakub Pachocki、Szymon Sidor、Łukasz Kondraciuk等人。

他们成为OpenAI最初团队的核心力量,甚至在OpenAI内部还出现了「波兰黑手党」(Polish Mafia)这一说法。

他们在Slack上有一个共同的频道,偶尔会往里面发一些与AI相关的波兰新闻。

被低估的OpenAI「波兰军团

在OpenAI早期与核心研究中,有多位波兰背景研究者或工程师贡献突出。

其中有一位OpenAI的联合创始人、一位前研究副总裁,还有一位是大名鼎鼎论文《Attention is All You Need》的合著者。

Jakub Pachocki

打开网易新闻 查看精彩图片

Jakub Pachocki

自2017年加入OpenAI以来,Jakub历任研究总监等要职,是GPT-4等核心项目的领军人物。

在OpenAI早期,他致力于大规模强化学习与复杂博弈系统的研究,通过 OpenAI Five (Dota 2) 等项目,从实践层面验证了「规模化训练引发能力跃迁」的关键认知。

此后,作为核心负责人,他主导了 GPT-4 的研发工作,构建了集训练、优化与可扩展性于一体的「工程—研究」闭环体系,并在利用强化学习提升模型复杂推理与代码能力方面取得了突破性进展。

他的核心贡献在于确立了大模型结合强化学习(RL)的规模化方法论,将前沿研究转化为可复用的训练体系,并成功带队交付了具有代际意义的关键模型。

2024年5月,Jakub接替Ilya Sutskever成为OpenAI首席科学家

Łukasz Kaiser

波兰计算机科学家和机器学习研究员,长期从事深度学习基础研究。

他曾获得德国RWTH Aachen University计算机科学博士学位,并在法国国家科学研究中心(CNRS)担任研究员。

Łukasz Kaiser曾是Google Brain的研究科学家,对注意力机制和Transformer架构的发明贡献巨大,是《Attention is All You Need》论文的合著者之一,这一架构成为了现代大语言模型的核心基础。

打开网易新闻 查看精彩图片

Łukasz Kaiser

Łukasz Kaiser于2021年加入OpenAI,从事大模型与推理相关研究工作;公开资料显示他参与过ChatGPT及GPT-4多模态方向的研发,并与团队推进o1等推理模型相关工作。

Łukasz Kondraciuk

打开网易新闻 查看精彩图片

Łukasz Kondraciuk

波兰工程师/研究人员,被列为OpenAI o1推理模型的贡献者之一。

他是早期团队成员之一,在ChatGPT和AI开发中有实际贡献。

Szymon Sidor

Szymon Sidor目前担任OpenAI的技术研究员,持有剑桥大学计算机科学学士学位,以及麻省理工学院机电一体化、机器人技术和自动化工程硕士学位。

打开网易新闻 查看精彩图片

Szymon Sidor

他自2016年左右加入OpenAI,是OpenAI早期研究者与核心技术驱动者之一。

他在构建GPT-4模型中发挥了重要作用,更是与Ilya、Łukasz Kaiser共同在大语言模型中引入强化学习(RL)的关键人物,直接催生了后来的o1推理模型。

奥特曼称赞他为「不知疲倦」,指出他在解决看似不可能的问题方面的作用。

Wojciech Zaremba

波兰裔计算机科学家,他是OpenAI的联合创始人之一。

打开网易新闻 查看精彩图片

Wojciech Zaremba

Zaremba持有华沙大学和巴黎综合理工学院的数学硕士学位,以及纽约大学计算机科学博士学位,曾师从Yann LeCun和Rob Fergus。

在加入OpenAI前,他曾在Google Brain和Facebook AI Research实习,从事神经网络、对抗样本和分布式训练等方面的研究。

2015年,Zaremba与奥特曼、马斯克、Ilya Sutskever等共同创立OpenAI。

他最初领导机器人团队,2020年后他转向领导GPT系列模型、Codex和代码相关团队,是公司战略和技术发展关键人物之一。

Jerry Tworek

也称Jarosław Tworek,前OpenAI研究副总裁。

打开网易新闻 查看精彩图片

Jarosław Tworek

他在华沙大学获得应用数学硕士,于2019年加入OpenAI,领导了o1、o3、Codex、GPT-4等早期工作,被业界誉为「大语言模型推理能力发展」的关键人物。

据媒体报道,2026年1月,他离开OpenAI,创办Core Automation,开发需要更少数据和计算的新型AI模型。

他表示离开是为了追求在OpenAI难以开展的核心研究,并认为AI进入「研究时代」,需要新的突破。

Ilya、Tworek离去

「波兰军团」能否再造奇迹?

2023年微软CTO Kevin Scott邮件揭露,OpenAI首席科学家Ilya对门徒Jakub Pachocki研究突破和晋升不满,导致与CEO奥特曼冲突,引发董事会解雇奥特曼事件。

Ilya的离开,是OpenAI在战略转型中,逐渐将算力资源向ChatGPT相关应用部门倾斜的必然结果。

在这个过程中,兴趣在纯研究领域的Ilya败给了善于拿出实际成果的徒弟Jakub。

Scott在邮件中写道:

Jakub比Ilya更能够推动研究突破,以至于奥特曼晋升Jakub负责主要模型方向。此后Jakub工作加速,在最近几周取得惊人进步。

导师地位被颠覆令Ilya难以接受,应用部门(如ChatGPT)成功导致研究部门GPU和人力短缺,在双重因素的打击下,心灰意冷的Ilya离开了自己参与创建的OpenAI。

令人唏嘘的是,Ilya离去之后,今年1月,六人波兰军团中的一位——OpenAI研究副总裁Jerry Tworek也宣布离职。

在OpenAI呆了整整七年的Jerry,因为多次向管理层申请更多的算力和人员支持无果,最后与Jakub Pachocki之间爆发了冲突:

Pachocki更看好现有的、能快速见效的大语言模型架构。公司需要的是能马上落地的产品,而不是不知何年何月才能跑通的理论。

Tworek、Ilya等一系列核心科学家、研究员的离开,背后是ChatGPT等应用部门「吃掉」关键算力资源,基础、前沿研究正在被边缘化的现实,也曾被外部解读为OpenAI理想主义的一种倒退。

甚至有网友认为,OpenAI将因此失掉其曾经在基础研究领域的领先地位,只剩下品牌价值。

当AI已进入「研究时代」,对于OpenAI、Anthropic、谷歌DeepMind这样的全球顶尖AI实验室来说,基础和前沿研究才是推动发展的根。

没有了研究上的领先,OpenAI想要复制下一个「ChatGPT」时刻就会遥遥无期,再厉害的「波兰军团」恐怕也无能为力。

参考资料:

https://x.com/trajektoriePL/status/2018242446577086589

https://www.geekwire.com/2026/the-microsoft-openai-files-internal-documents-reveal-the-realities-of-ais-defining-alliance

https://en.wikipedia.org/wiki/Removal_of_Sam_Altman_from_OpenAI

打开网易新闻 查看精彩图片