2024年某个星期,Meta公司快速行动,一次签下四位之前在OpenAI工作的华人工程师,赵晟佳负责模型架构设计,完整参与了GPT-4开发,余家辉专注于多模态技术,是GPT-4o团队的核心成员,毕树超熟悉产品落地流程,过去在谷歌管理广告算法项目,任泓宇承担后训练和人机交互任务,这四人合计薪酬接近一亿美元水平,这不是普通加薪行为,而是把从模型设计、感知系统搭建、产品上线到演示交付的整个链条拆开搬了过去。
这四位工程师目前在美国工作,他们的技术基础是在中国打下的,本科时就投入ACM竞赛训练,大三开始编写实际系统代码,学校提供的资源有限,他们就自己钻研技术细节,优化性能,追赶项目截止日期,这种培养方式不追求灵光乍现的创新,而是让人在算力紧张、时间紧迫、模块冲突的环境下坚持把系统调通,美国高校注重发表顶级会议论文,中国工程师更擅长将论文成果转化为实用工具,Meta公司需要的不是会数学推导的人才,而是能精准定位关键代码、避免系统崩溃的实践者。
Meta最近有些着急,Llama系列的更新速度变慢,开源模型的优势正被竞争对手逐渐赶上,公司新设立了一个Superintelligence Labs,这个实验室的负责人来自Scale AI和GitHub,目标很直接,不做复杂的理论探索,只专注于开发能够快速部署的基础模型,这次招聘是整体计划的一部分,用资金换取经验,这四个人带过去的不是几行代码,而是许多未写入论文的实际问题,例如长文本处理时如何节省内存,语音响应怎样保持流畅,多模态数据如何协调延迟,这些经验,开源社区难以复制。
现在不光是Meta公司,英伟达、谷歌和Anthropic也都在悄悄开通面向中国背景人才的渠道,他们不招纯学术型人才,专门盯着从国内985高校毕业、又在一线互联网公司实际搭建过模型的人,中国这边在芯片和高性能算力上受到限制,反倒让技术人才成了高性价比的输出资源,中国的教育体系不断培养出能扛住压力、会调节参数、懂得落地的工程师,美国那边用资本和产业生态接住这些人,再把他们安排进自己的产品闭环里,这不是单向的人才流失,更像是全球分工正在重新洗牌:中国负责练手速,美国负责定方向。
有意思的是,Meta没有公布具体的工资数额,但有消息说,除了现金报酬,他们还把Llama 5路线的一部分主导权给了工程师,这意味着在国内,就算你是顶级工程师,可能连模型结构调整都说不上话,但在硅谷,你就能坐在会议桌前,参与决定下一代模型的样子,钱当然重要,但更关键的是,你有没有机会去定义什么是好模型,这种差距,比工资数字更让人感慨。
这四个人的经历,表面上是猎头之间的较量,实际上代表着两种不同体系的碰撞,一个体系依赖长期高压训练来培养抗压能力,另一个体系依靠生态整合来实现扩展能力,现在还不能确定哪个更占优势,但可以预见的是,未来AI领域的竞争将不再局限于人才争夺,而是要看哪套系统能让新手快速成长为能担当重任的熟手。
有人觉得人才外流是件坏事,我倒不这么想,如果国内的机制不改变,光靠感情留住人才,只会让有能力的人越来越不愿意表达意见,反过来想想,假如有一天我们能让一线工程师直接参与到架构决策中,那就不怕别人来挖人,因为最好的人才根本不想离开。
热门跟贴