打开网易新闻 查看精彩图片

宋乐在2026夏季达沃斯现场

在大连夏季达沃斯的会场内,GenBio AI 联合创始人兼首席技术官、MBZUAI 机器学习全职教授宋乐聊起自己这些年的轨迹:从蚂蚁金服的金融风控,到百图生科的蛋白质预训练,再到硅谷创办 GenBio AI,用“世界模型”模拟细胞对药物的反应。

2017 年起,他便与中国互联网巨头合作,把深度学习、图神经网络和预训练模型用于金融风控与产品推荐。这些技术和今天的 AI 制药看似毫无关系,但底层逻辑是相通的:“后面的技术有很多相同点,医药行业既有它的特性,也需要对 AI 方法有深层理解,然后有针对性地迁移和创新。”

疫情之后,中美之间的科技合作变得紧张,他最终选择去硅谷进行虚拟细胞世界模型方向的创业,同时与阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)深度合作。这个选择背后,是他对全球 AI for Science 生态格局的判断。

虚拟细胞:为世界模型找一个生物宿主

药物研发的痛点,在宋乐看来,并不只是“设计不出好分子”。更大的瓶颈在于,即使找到了分子,也要反复做湿实验,去验证它在疾病细胞,组织,器官甚至个体里到底有没有效。

“不管是生成模型做的分子,还是传统方式找到的分子,都要做各种各样的试验。中间有个环节,就是验证它是不是在某种疾病的细胞,比如癌细胞里,有对应的效应。这个湿实验周期很长。如果还要考虑后面的组织,器官甚至临床个体,那时间就要10年左右

GenBio AI 想做的,是用 AI 把细胞,组织,器官甚至临床个体对药物的响应变成一场“数字孪生”。这个系统的第一步为虚拟细胞,一个能够预测细胞在药物扰动下如何变化的世界模型。它不但可以模拟单个分子,还可以模拟细胞层面的整体反应,从而把大量原本必须湿实验完成的工作搬到计算机里。

这与当下多数 AI 制药公司的单点打法不同。宋乐用了一个比喻:“药物作用在一个靶点上,就像一个个人;但这个人在一个群体里,群体在一个组织里,组织又在一个更大的社会结构里。你想治愈的,不是这个人,而是整个系统。”

因此,虚拟细胞的关键不仅仅是预测一个蛋白和一个小分子的结合强度,而是把药物作用从靶点扩散到细胞、再扩散到细胞的整体状态。这需要一种系统性的世界观,而世界模型正是提供这种一致性的工具。

不过,宋乐对它的成熟度保持着清醒。他把现阶段的虚拟细胞比作 AlphaFold 1 前夜的时间点:“它展示了世界模型能把事情做得更好,但还没有做到比现有方法有优势还不足够明显。真正到 AlphaFold 2 甚至 AlphaFold 3 的阶段,可能还需要三到五年。”

构建虚拟细胞的三重挑战

虚拟细胞的雄心,建立在数据和算法两条腿上。

数据是第一步。宋乐指出,生命科学过去积累的数据虽然多,但往往“像随机探索美食”,缺乏多样性和代表性。要训练一个有泛化能力的世界模型,必须系统性地产生更有针对性的数据。

但数据并非越多越好。他很直白地说:“越多数据越好,但越多数据也意味着越高的成本。” GenBio AI 的研发方向,是在深度模型架构和训练方式上创新,用更少的数据实现更好的效果。

这就涉及到第二条腿:算法架构。宋乐区分了两种思维方式。

一种是“快思维”:深度学习擅长直接做像素级、数据驱动的生成,即使没有真正理解物理规律,也能生成逼真的图像。另一种是“慢思维”:像中学做物理题那样,基于符号抽象和已知规律进行推理。虚拟细胞要把两者结合起来:既要能吸收海量数据做预训练,又要把生命科学已知的正负反馈、基因调控、蛋白质相互作用等规律通过推理形式融合进去。

此外,为了让模型能适配不同合作方的细胞类型和疾病数据,GenBio AI 还构建了一套 Virtual Cell Harness 的 Agent 系统。宋乐解释,大模型本身“不够聪明,不能长时间运行”,Harness 就像一个外部记忆和自动化工具,帮助世界模型记录历史信息、整理上下文,并自动生成代码来适配新的虚拟细胞。

在产品形态上,这家成立不久的公司仍处于种子阶段。他们正与英伟达和多家药企开展试点合作,英伟达提供计算资源和底层sdk支撑,药企提供数据和问题,GenBio AI 提供虚拟细胞模型和软件系统。“我们不需要一千个客户,现阶段更主要的是和 Pharma 做一些 pilot study,从 0 到 1,从 1 到 10。”

AI for Science 的全球地图

宋乐之所以把公司放在硅谷、把研究合作放在阿联酋,是基于对不同生态位差异考量。

在他看来,美国/欧美在原创性创新和人才完备度上仍然得天独厚。“做 AI for Science 的创新探索,以及资本对这种探索的理解,都是最好的。”美国有大量 NeoLabs 式的公司、跨学科培养体系和愿意投入前沿研发的大药企,计算生物学的毕业生能找到对口工作,这种产业链的完整度是中国尚不具备的。

中国真正的优势是工程师文化。 “很务实,工作也很努力。一旦看到清晰方向,可以集中意志把事情做得更快、更大规模。”宋乐认为,在CRO 服务、管线落地、临床试验资源上,中国有明显的成本和效率优势。中国成熟的 CRO 产业链、庞大的医院患者资源,都让药物后期开发更便宜、更快。但问题在于,很多学生毕业后找不到 AI for Science 的对口工作,反而流向互联网公司,这会导致原创性人才断层。

阿联酋则是一个新兴的战略支点。 得益于王室支持,MBZUAI 由现任总统创办,宋乐自 2021 年起就在该校任教。阿联酋还有一个国家战略级的基因计划:已测序近 100 万人的基因组,并与医疗记录关联。宋乐希望借此构建“虚拟细胞库”,为每个人的数据适配一个虚拟细胞,预测药物对这个人的响应。数据不会离开当地,而是在受控环境中完成适配和微调。

“阿联酋有点像中东的瑞士,”宋乐说,“比较中立,和中国、美国都比较友好。它在 AI 方面的投资已经能排进世界前五。”

面对这场漫长的技术马拉松,宋乐保持耐心。他相信虚拟细胞会有自己的“AlphaFold 2 时刻”。未来的某个时刻,模型的准确度突然接近实验水平,从而替代大量湿实验。他的保守预测是:大约五年。

而在此之前,GenBio AI 要做的是继续迭代虚拟细胞与其构建技术,继续把数据、架构、Agent 和商业化 pilot 打磨清楚。在宋乐眼中,AI 制药的下一阶段,不是再做更好看的分子生成器,而是让世界模型真正理解生命系统。“让细胞先活在计算机里”,或许比让药物先上市更重要。(本文首发钛媒体APP,文 | DeepWrite秦报局,作者|秦聪慧 )