打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

赢在起点的 AI Lab,为什么逐渐被时代甩在身后?

作者丨成仲轩 梁丙鉴

编辑丨董子博

2015年,腾讯总裁刘炽平从李嘉诚家族等人的口中,第一次听说了 DeepMind 的名字——一家还未进入公众视野的 AI 公司。

鲜为人知的是,这条线索的起点,隐藏在一条华人血脉里。

DeepMind 创始人兼 CEO Demis Hassabis 的母亲是新加坡华人,Demis 也与香港投资圈关系颇近。

事实上,就连李嘉诚本人都是 DeepMind 的 LP,并坦言“能参与 DeepMind 早期投资是可贵的缘份。”

通过香港资本圈的这层关系,刘炽平得知 DeepMind 正在秘密开发一款划时代围棋 AI。想要在腾讯内部组建全新 AI 研究组织的他,迅速安排腾讯负责技术的高管、时任副总裁的姚星等人,远赴英国向 Demis 取经。

2016 年前后,姚星往英国飞了三个来回,目的十分明确——“以棋会友”。

论起围棋,姚星在野狐围棋上打到业余六段,并非弱手。但他会见的这位“棋手”更不简单:先在私下 5:0 完胜欧洲围棋冠军、职业二段的樊麾,又在后来力克两位世界冠军。

今天,这位棋手的真身并不难猜,它就是 AlphaGo。

而彼时与 Demis 往来日益密切的姚星,回国后也将这一套深度学习的框架带回腾讯,让公司的“内部搜索”团队(也被称作“内搜”)先从象棋 AI 开始研发。没想到,团队却意欲直取围棋 AI,并在两周内就拿出了一个版本,和姚星本人对局。

AI 虽然厉害,但姚星在棋力上也不落下风,与 AI 摆开架势对弈,还能略胜一筹。这个围棋 AI,虽然还不及业界前沿,但的确展现出了一些“灵气”。

这样的成果,也让姚星在公司内部组建 AI 前沿团队变得容易了许多——同时期,一个名叫 AI Lab 的组织在腾讯出现,此后十年,成为腾讯 AI 研究的核心力量。

在腾讯,一个属于 AI 的全新时代已然到来。

(关于腾讯 AI 的系列文章仍在持续推出中,雷峰网目前也正在关注微信 Agent 的相关信息,欢迎添加作者微信:GO-GO-ZEPPELI,交流认知,分享八卦。)

01

学术有影响,工业有产出

腾讯的 AI Lab 肇始,应该 2016 年开始算起,相比百度引入吴恩达、Geoffrey Hinton 加入谷歌,甚至还晚了几年。

梳理腾讯 AI Lab 的早期架构,在 TEG 总裁卢山和院长姚星之下,是主任张潼、副主任俞栋,以及 NLP、视觉、机器学习、语音四个中心,分别负责四个方向,从史树明、刘威,到黄俊洲、黄志恒等中心总监级别的人物,都是姚星亲自面试。

关于最早期的 AI Lab“三剑客”——张潼、俞栋和刘威,先前在 Lab 的同学华胜给雷峰网分享了一则趣闻:张潼和俞栋作为正副主任在 Lab 的主页上当然更靠前,而刘威则是沾了上传照片更早的光,就成为了“三剑客”之一,其实和不少人算是同期加入 AI Lab。

后来没过多久,张潼又引荐了一位名叫刘晗的人加入了 AI Lab,新起了一个中心——于是,最早期 AI Lab 五个中心的架构就正式形成,每个中心 HC 在 10 人左右,算上支持团队,一共不过 60-70 人。

而在 AI Lab 之外,姚星又在 TEG 内部设立了“AI 平台部”,前身就是前面提到的“内搜”团队。这个团队最早是做腾讯的“搜搜”起家,后来在“搜搜”被卖给了搜狗之后,团队仍然留下了一些人,在腾讯内部提供搜索技术的支持。

AI 平台部本身也归属姚星负责,但姚的主要精力更多集中在 AI Lab 上,平台部最早则由后来创业“超参数”的刘永升(公司内人称“卡卡”)来牵头,后来在混元大战中发光发热的王迪、今天主掌游戏 AI 业务的杨巍,则都是出身 AI 平台部的老臣。

和 AI Lab 的合作上,AI 平台部更倾向于对 NLP 业务提供工程支持,于是 Lab 的 NLP 中心工程人员招入不多;而到了视觉、语音等方向,Lab 也慢慢开始逐渐扩招工程人员,编制也逐渐扩大。

早期,AI Lab 的人数慢慢扩张到了 100 人左右,当时的 AI 平台部则有约 300 人,两边虽然对内分属不同的组织,但对外都叫自己腾讯“AI Lab”。

张潼时代,姚星虽然不直接管理 AI Lab,但实际对 Lab 方向的掌控仍然有拍板权——他自己组织例会、也和张潼一起出席,接受各个中心的汇报,事必躬亲。在 Lab,脾气火爆的姚星“骂”过的人不少,但手下对他评价却都一致很高,把他看成是一个直接但实在的领导。

另一边,张潼虽然是 AI Lab 的主任,但他的兴趣却更多在学术上,相比管理,他专注自己的研究更多,颇有些世外高人的作风。

在 AI Lab 刚成立的那几年,因为人工智能也刚刚兴起,所以腾讯给予了 AI Lab 充分的科研自由,后者可以专注提升自己的学术影响力。据说,为了招揽张潼,腾讯甚至开出“五年不考核业绩”的条件,即 AI Lab 在其治下的前五年可以“只花钱不挣钱”,且承诺在此期间不淘汰任何成员。

在张潼下面,几个中心也分头进行探索,自由度很高。

在成立早期,姚星亲自为 AI Lab 定下了一个“目标”:学术有影响,工业有产出。这两点也一直是 AI Lab 团队和员工晋升的考核方向:答辩时,不仅看发了多少论文、参加了多少顶会;还要看对于公司的实际业务做出了哪些实质性的贡献。

在之前的《》一文中,雷峰网就深度分析过,AI 研究院的架构与业务团队的“不清不楚”,就容易导致前沿探索和工业产出脱节。这个问题,也延伸到了后面腾讯 AI Lab 和优图实验室的竞争当中,不过这里先按下不谈,后文再着墨细谈。

而张潼时代的结束,根本原因也是学术和工业两端的拉扯。事实上,在张潼时代,AI Lab 的产出更多聚焦于 Tencent ML-Images 等开源数据集和论文的贡献上,显然以基础研究为重。期间虽有围棋 AI 绝艺一鸣惊人,但终究没有成长为商业化的产品。

而在学术和工程的拉扯中,受影响严重的,是被张潼招进了 AI Lab 的刘晗。

打开网易新闻 查看精彩图片

刘晗

在 AI Lab,刘晗是机器学习中心的负责人,研究方向与张潼一脉相承;同时,刘晗也有很深的学术背景,曾在普林斯顿大学和约翰霍普金斯大学执教,还拥有美国西北大学的终身教职,与横跨学界和大厂的张潼也有着相似的过往,也是张潼在来到腾讯之前的旧识。

然而,在对刘晗的看法上,张潼和姚星却逐渐产生了一些不同——机器学习理论固然重要,但在一些旁观者看来,刘晗采用的研究方法,却更似在高校,不似在大厂。这种身份的调转,绝不是刘晗一人的难处,体现的是同时期学术和工业界融合时,不少人的共性难题。

如此,刘晗没过多久,便离开了 AI Lab。这件事,对于张潼随后的离职也有着不小的影响。

在 AI Lab,张潼的位置比起“主任”,更像一个“首席科学家”,他不仅自己就是一支技术探索的先锋军,更是一块学术圈的金字招牌。在当时 AI Lab 的 Slogan 当中,“学术有影响”要排在“工业有产出”之前,这也是当时 Lab 整体方向设计的一个缩影。

在 AI Lab 的不少老员工看来,姚星对于张潼的期待,是让张潼少做一些管理,而是发挥他的强项,做技术的最高负责人——然而,这样的定位,也和“AI Lab 主任”的名头实际不符。

一个草创期便在 Lab 工作的员工表示道,在采取实际动作让张潼交出管理权之前,姚星就已经和几个中心的负责人聊过,获得了大家的支持。

而后来的张正友,则深知自己前任的困境,用更深入的姿态参与到 AI Lab 的工业产出和人事管理当中,这也是后话,我们马上就谈。

于是,在来到腾讯一年多之后,张潼也离开了腾讯。刚刚提到的 AI Lab 初创曾和雷峰网分享到,学术天赋极高的张潼最善数学,在公司常常能看到他订下一个会议室,在里面和实习生推算公式,一推就是一天——张潼的个性,也可见一斑。

02

工业有产出,学术有影响

2018 年 3 月,姚星主导成立了 Robotics X 实验室,使腾讯成为最早布局具身智能赛道的大厂之一。张正友也是此时被卢山和姚星招入,以 Robotic X 主任的身份,加入了腾讯。

张潼表露去意后,副主任俞栋,最早才是 AI Lab 主任的第一顺位人选。但彼时的他正担任腾讯西雅图 AI 实验室的总负责人,不愿离开,并向公司推荐了张正友。巧合的是,张正友也是张潼的推荐人选。

面对姚星的盛情邀请,张正友表示自己更感兴趣的其实是 Robotics X。对此,腾讯的回应是双倍 offer,Robotics X 和 AI Lab 兼管,并承诺在 AI Lab 不设 KPI,让张正友能更顺利地完成和 AI Lab 组织的融合。

不同于张潼,来自微软研究院的张正友,在工业界的经验更加丰富,有很强的工程落地眼光,亦有很强的管理能力与意愿——这也恰好与姚星彼时的着眼点不谋而合。

“正友老师就像一座桥梁,连接了学术界与产业界,让 AI Lab 走向了一个新时代。”另一位前 AI Lab 成员补充道。

从 Robotic X 来到 AI Lab,张正友花了一段时间来适应新的身份,在一次有姚星参与的内部小范围谈话中,甚至口误说出过“你们 Lab”的言论,在内部还引起过一些不满。

然而,姚星对张正友仍然相当支持,甚至为此提醒过脾气耿直的刘威,要和张正友把关系处好。

2019 年,张潼离职后,姚星便牵头,将过去的 Slogan 修正成了:“工业有产出,学术有影响”。只是简单地把两句话的顺序调换了一下,就能看出当时 AI Lab 的重心,正在从学术探索,开始向工程落地转型。

早先,Lab 的编制里,就有工程人员的位置,除了 AI 平台部更多支持的 NLP 中心之外,语音和视觉中心也吸纳了不少工程人员,工程团队的总负责人双线向语音和视觉两个中心负责人汇报。

实际上,在 AI Lab 成立刚不久的时候,顺应着公司 MIG(移动互联网事业群)推出“翻译君”、微信快速发展语音识别技术的风潮,TEG 的 AI 平台部也和 Lab 的语音中心一起合作,研究 AI 同声传译的能力,并且进展飞速。

这之后,在这种相互赶超的积极氛围下,极少与其他事业群合作的微信,也让自家的产品“微信智聆”和翻译君一起联合推出了“腾讯同传”,服务博鳌亚洲论坛。小马哥甚至专门发布了一条朋友圈,称这是一次“新尝试”,请大家反馈效果,多多包涵。

打开网易新闻 查看精彩图片

然而早期,在学术团队话语权更重的 Lab,工程团队的工作常常是给学术团队打助攻,帮忙发论文——这也与姚星设置工程团队的理念相去甚远。

张正友来到 AI Lab,做的一件大事,就是在内部设置了产研中心,用更高的优先级,去攻关 AI 技术的工业落地。产研中心的人数,一度占到整个 Lab 的一半之多。

在雷峰网先前的文章中提到,张潼之后,AI Lab 管理科学家的方式产生了不少变化——在张正友时代,姚星给了他更大的管理权限,让他更像一个 Lab 的“主任”,自己相对回撤,把更大的自由给到 AI Lab 的体系里。

于是,增设产研中心,张正友在内部也并未遇到太大的阻力。

在产研中心,张正友希望的,是把 AI 技术 PaaS 化,把比如语音的 SR(说话人识别)、TTS(语音合成)等技术模块封装成平台型产品,做标准化服务,让使用者直接调用 API,以形成更大的影响力。

彼时在大环境上,AI 四小龙正式完成崛起,让资本和市场对于 AI 的热情高涨;而这段时间,也是腾讯 AI Lab 技术落地的高峰期:诸如农业 AI iGrow 系统、虚拟人技术、人脸识别系统、语音前端技术等成果,已经在腾讯多个产品和业务中落地应用。

沿用 PaaS 的理念,也符合 AI Lab 作为技术中台的组织设计初衷,但问题却出在了用人的层面上。

新设的产研中心对于 AI Lab 原有架构的冲击,在雷峰网“腾讯 AI·五问”的文章中都有提及——在产研中心,如 AI Lab 的架构设计一样,下设了 NLP、语音等几个组,与 Lab 的几个中心的研究内容也有所重叠。

而作为亲设的部门,张正友也不吝把资源向产研中心倾斜,这也在实际上让产研中心和 Lab 另外几个中心的关系有些尴尬。最初的设定,是把新招入的博士给 Lab 几个学术中心做研究,把研究生放进产研中心负责工程。而慢慢地,产研中心人才密度问题开始显现,博士生也开始流入产研中心,这让产研中心和其他中心的差异变得越来越小。

一位 AI Lab 的老员工对雷峰网分享,在 NLP 领域,产研中心拿下了王者荣耀 AI 解说的工作,NLP 中心则转向了对智能写作的攻关,与兄弟部门平行工作;而语音领域的研究门类相对比较集中,不过是 SR、TTS、声纹识别等几个方向,产研中心和语音中心两个部门的工作,难免有重合的部分,这就让彼此的工作中多了一些难处。

学术和工程相互掣肘,这显然并不是腾讯乃至姚星调整的本意。然而,姚星本人也在 2021 年离职创业,乘着元宇宙的大潮创立了“元象科技”,今天仍然活跃在 AI 和 3D 领域的第一线。张正友则在不久后升上了 17 级,成为了腾讯职级最高的技术人才。

谈起姚星,不少在 AI Lab 与他共事过的人,都把他称为 Lab 一时之间的“灵魂人物”。“他是真正希望能把 Lab 做好的人,”和姚星在腾讯共事过的毕统说道,“因为 Lab 是他一手建起来的,跟自己亲孩子一样。”

在姚星离职不久之后,张正友再一次地把 AI Lab 的 Slogan 改回了“学术有影响,工业有产出”,虽然对内释放出了要把学术研究放在更高优先级的信号,但实际上产研中心仍然占据着更多的资源,AI Lab 的动荡也仍在继续,大量人才离职,这也为之后腾讯 AI 的发展轨迹造成了影响。

03

论文大战,AI Lab 与优图实验室的“一时瑜亮”

在腾讯 AI 的发展历程上,优图是一个无法被绕过的名字。

作为腾讯的另一个 AI 研究重镇,优图曾在 2016 年被 SNG 总裁汤道生尝试提升为整个集团层的计算机视觉中心,不仅服务 SNG 事业群的 QQ 体系,更要赋能万业。

但此举引起了 TEG 总裁卢山的注意。尤其在 AI Lab 成立后,其与优图虽然分属 TEG 和 SNG 旗下,但二者同为腾讯 AI 业务的两大支柱部门,相近的研究方向与同样豪华的学者阵容,也让两个团队大有同台竞技之意。

因此当汤道生试图通过优图掌握集团层的 AI 话语权时,卢山不可能将之拱手相让,更有了高举高打 AI Lab 的理由。

不过,无论是卢山、汤道生,还是 AI Lab 与优图的多位领导人,都曾在多个场合强调各自的实验室没有营收 KPI。比如张潼,在谈到 AI Lab 的考核指标时就坦言:“其实还是相对比较宽松,主要会关注 paper 的发表和产品的应用。”

相比营收 KPI,论文 KPI 无疑更容易量化、也更容易建立学术影响力。

论文 KPI,也成为这一时期 AI Lab 与优图的主要考核指标,以及共同的发力方向。

2017 年,AI Lab 率先亮剑,在 ACL、ICML、NIPS 等多个国际平台上取得出色表现。刘威带领下的计算机视觉团队,更是在 CVPR(IEEE 国际计算机视觉与模式识别会议)上入选 6 篇论文,备受行业认可。

只是这份喜悦很快就被冲淡。在随后举行的 ICCV(国际计算机视觉大会,与 CVPR、ECCV 并称计算机视觉领域三大顶级会议)上,贾佳亚带领下的优图成绩更加亮眼:入选论文 12 篇,位居行业前列。

转折出现在 2018 年。

据内部人士透露,刘威对论文数量的更多关注,影响并拉动了整个团队的论文产出——在 CVPR 2018 上,AI Lab 入选 21 篇论文,是上一年的 3.5 倍。

但这还远未结束。除了在 ACL、Interspeech、AAAI、EMNLP 等国际平台上捷报频传,AI Lab 这一年在 ECCV(欧洲计算机视觉大会)上风头之盛,甚至盖过优图:入选论文 19 篇,比优图足足多出 8 篇。

AI Lab 是不是已经走在了优图前面?彼时外界议论纷纷。

2019 年,优图用行动给出答案。

没有想象中的自乱阵脚。在两年一届的 ICCV 上,优图入选论文 13 篇——较前次稳中有进。在 CVPR 2019 上,优图的论文入选数也再创佳绩,达到 25 篇。虽然逊色于 AI Lab 的 33 篇,但差距已经明显得到控制。

如果聚焦医学影像分析领域,在这一年的 MICCAI(国际医学图像计算和计算机辅助干预会议)上,优图则与 AI Lab 旗鼓相当,各自入选了 4 篇论文。

不过,就在 AI Lab 与优图围绕论文产出在国际舞台上大放异彩的当口,贾佳亚的离职,打了所有人一个措手不及。

据内部人士猜测,导火索或许是“930 变革”后,集团引入优图的新考核指标。

简单来说,随着“930 变革”的开启,优图随汤道生一起划入 CSIG(云与智慧产业事业群),并开始承担 CSIG 的一部分营收 KPI。

但优图内部长期实行以贾佳亚和吴运声为核心的双领导制,让现实情况更加复杂:贾佳亚主外,聚焦学术影响力和科研成果,不承担直接的营收 KPI 考核,向 CSIG 负责人汤道生汇报;吴运声主内,聚焦产品化赋能,承担优图视觉技术和云底层融合的相关工作,向腾讯云 CTO 王慧星汇报。

同属一个部门,但有两位领导,两种汇报体系,两个发展目标。这种兼顾学术影响力与技术落地的发展愿景,显然存在不小的实现难度。加之坊间曾传闻,优图在论文产出上略逊于 AI Lab 的事实,让贾佳亚在集团内部的地位一度受到质疑。

凡此种种,或许都促成了贾佳亚最后的离开。

至于隔壁的刘威,虽然带领团队在论文产出上屡创佳绩,但此后也离开 AI Lab,转入由腾讯副总裁蒋杰率领的数据平台部,担任广告多媒体 AI 中心主任,也在后续混元的开发中起到了不可忽视的作用。

不过,就在 AI Lab 与优图双双进入人事变动期的彼时,国内 AI 行业也逐渐进入沉寂期,深度学习和 AI 商业化双双遇到瓶颈。而身处这场行业变迁的 AI Lab 也受到波及,加之人才的大量出走,都让 AI Lab 此后数年的发展脚步愈发谨慎。

04

结语

2022 年 11 月底,GPT-3.5 发布,引爆了全球大模型热潮。但布局 AI 多年的腾讯,却把混元大模型的发布时间推迟到次年 9 月,比百度、阿里都晚。

腾讯自然有不急于下场的理由:直到今天,微信作为入口的优势仍然难以撼动。

看起来,腾讯似乎是最能吃到模型红利的公司。

但另一个不能忽视的事实是,字节在 2025 年完成了 Seed 团队对 AI Lab 等研究部门的整合,阿里通义体系也在这一年结束了对达摩院、AI Labs 等基础研究力量的收编。和这两者对比,腾讯混元团队在整合深度上显然没有完全承担起集团级 AI 研究中枢的角色。

是战略使然?还是一步慢,步步慢?

而这,就是另一个故事了。

(关于腾讯 AI 的系列文章仍在持续推出中,雷峰网目前也正在关注微信 Agent 的相关信息,欢迎添加作者微信:GO-GO-ZEPPELI,交流认知,分享八卦。)

打开网易新闻 查看精彩图片