打开网易新闻 查看精彩图片

这不是偶然,AI行业烧掉的算力和资金,终究要找到一个足够大的出口。那么,为什么选择了生命科学呢?

生命科学为什么突然成了AI巨头眼里的香饽饽?原因就在于生命本身就是一个超级复杂的信息系统,而生命科学可能改变药物研发、疾病治疗,甚至改变人类理解生命的方式。

过去这么多年来,生物学家通过各种方式,对人体、细胞、蛋白质、基因序列开展了一系列研究。但问题是,生命系统太复杂了,人类积累的数据越来越多,真正能被理解和利用的比例却有限。

打开网易新闻 查看精彩图片

所以,美国AI巨头想让模型参与发现问题、提出假设、设计实验、筛选分子,以寻求在生命科学领域的突破。

如果要找AI进入生命科学的标志性事件,AlphaFold绕不开。

蛋白质由氨基酸组成,真正决定蛋白质功能的是折叠后的三维结构。这个结构决定它能否结合靶点、传递信号,能不能成为药物设计的入口。过去解析一个蛋白结构,可能要花很久,还不一定成功。AlphaFold的出现,把这个难题往前推了一大步。

Google DeepMind后来联合EMBL-EBI开放了海量蛋白结构预测数据,覆盖超过2亿个蛋白结构。对生命科学界来说,这相当于突然多了一本巨大的分子地图。虽然预测不等于实验结果,仍然需要验证,但研究人员至少不再完全摸黑。

打开网易新闻 查看精彩图片

此外,AlphaFold 3还开始预测蛋白质、DNA、RNA、小分子、离子之间如何相互作用。药物研发最需要的,恰恰是判断一个候选分子能不能和靶点稳定结合,会不会产生副作用。这也是为什么Alphabet专门孵化Isomorphic Labs,并让它与大型药企合作,这让AI制药产业化看到了可能。

另外,OpenAI与Retro Biosciences还开展干细胞研究合作。双方训练了面向蛋白工程的GPT-4b micro,用来重新设计山中因子。山中因子是诱导成熟细胞回到多能干细胞状态的关键蛋白,背后涉及再生医学和衰老研究。OpenAI披露的实验结果显示,模型设计的变体在体外实验中显著提高了干细胞重编程标志物表达。

这个案例的意义在于证明大模型可以处理蛋白序列和结构信息,它开始具备一种新能力,按照人类设定的生物功能去设计分子,这对AI行业很重要。

打开网易新闻 查看精彩图片

因为通用聊天模型的商业边界终究有限,而生命科学是一个高门槛、高价值的行业。一旦模型能切进真实研发流程,它的价值就不再按会员费计算,而是跟新药、专利、临床项目、药企合作绑定。

打开网易新闻 查看精彩图片

Claude如果能成为科研人员和这些系统之间的接口,就有机会变成生命科学公司的“操作系统”。这与DeepMind的分子结构突破、OpenAI的模型推理和蛋白工程相比,切口不同,但目标一致,都是进入真实研发链条。

新药研发是一场昂贵的马拉松,按美国FDA流程,一款药物通常要经历发现、临床前研究、临床试验、审评和上市后监测。每一步都可能失败,每一次失败都意味着巨额资金和多年时间消耗。传统药物研发最难的地方,就在于不知道哪个想法值得继续烧钱。据估计,单个新药研发成本的估算范围从 3.14亿美元到44.6亿美元。

AI能解决所有问题吗?当然不能。生命不是简单的数学题,人体更不是一台完全可模拟的机器。AI预测再漂亮,也要过湿实验、动物实验和人体临床这一关。

但AI可以提前淘汰一部分低质量候选,帮助研究人员更快找到更有希望的靶点和分子。它可以提高试错效率,减少盲目搜索,把科学家的时间留给更关键的判断。这就是为什么药企愿意拥抱AI,也是为什么AI公司愿意进入药物研发。

打开网易新闻 查看精彩图片

从产业角度看,生命科学还有一个吸引力,就是天花板足够高。全球医药市场规模巨大,罕见病、神经退行性疾病、代谢病、衰老相关疾病,都有尚未满足的需求。AI如果能在其中任何一个环节带来实质提升,商业价值都可能远超普通办公软件。据估计,AI每年可为生命科学行业带来600亿至1100亿美元的经济价值。

回头看,美国三大AI公司聚焦生命科学,其实是AI发展到一定阶段后的必然选择。互联网时代争夺的是信息入口,移动互联网争夺的是用户入口,云计算时代争夺的是算力入口。到了AI助力科学时代,争夺的可能是科学发现入口,而AI应用于生命科学只是一个开始。