编译丨王聪
编辑丨王多鱼
排版丨水成文
日前,国际顶尖学术期刊Nature在其官网头条报道了 AlphaFold2 诞生这 5 年对科学的变革——自 2020 年问世以来,谷歌 DeepMind 推出的的这一改变游戏规则的 AI 工具已帮助世界各地的研究人员预测了数亿种蛋白质的三维结构【1】。
2020 年 11 月底,谷歌旗下公司DeepMind推出了AlphaFold2,这是一款用于预测蛋白质三维结构的人工智能(AI)模型,其能够仅根据蛋白质的氨基酸序列就精准预测出蛋白质的三维结构。实际上,其上一代版本于 2018 年发布,但预测准确率有限,并未获得多少关注。
2021 年 7 月,DeepMind团队在Nature期刊发表论文,公布了 AlphaFold2 的开源代码,并发表了完整方法论,详尽细致说明了 AlphaFold2 是如何做到精确预测蛋白质三维结构的【2】。
如今,问世五年的AlphaFold2变革了科学研究的游戏规则,帮助世界各地的研究人员预测了地球上各种生命的数亿种蛋白质的三维结构,带来了结构生物学的第二次复兴。
维也纳大学的Andrea Pauli一直在探究精子和卵子是如何结合在一起的。2018 年,她的团队在斑马鱼的卵子表面发现了一种名为“Bouncer”的蛋白质,该蛋白对于受精至关重要,但他们一直难以证明 Bouncer 是如何识别精子的。
就在此时,第一代的AlphaFold诞生了,2020 年,第二代的AlphaFold2诞生,2021 年 10 月,DeepMind 团队进一步推出了用于预测蛋白-蛋白复合物的结构和相互作用的AlphaFold-Multimer。
Andrea Pauli团队利用AlphaFold-Multimer发现了在精子和卵子结合中发挥关键的“媒人”作用的三种蛋白质——TMEM81、IZUMO1和SPACA6,没有这三种蛋白质,从鱼类到哺乳动物的有性繁殖可能会陷入死胡同。这一发现也颠覆了之前的观点,之前认为只需要两种蛋白质(一种在卵子上,另一种在精子上)就足以确保受精。而这一发现表明,受精作用比之前认为的要更加复杂,并不是“一把钥匙开一把锁”的旧观点了。
该研究以:A conserved fertilization complex bridges sperm and egg in vertebrates 为题,于 2024 年 10 月 17 日发表在了国际顶尖学术期刊Cell上【3】。
该研究表明,TMEM81是在鱼类和小鼠中必需的雄性生育因子,它与IZUMO1和SPACA6这两个之前已知的雄性生育因子相互作用,形成一个蛋白质复合物——TMEM81-IZUMO1-SPACA6,该蛋白质复合物分别与哺乳动物卵子上的JUNO蛋白或鱼类卵子上的Bouncer蛋白结合,从而连接精子和卵子膜,介导精子-卵子的结合。
对于Andrea Pauli而言,AlphaFold 为他们照亮了一条原本可能永远都找不到的道路。她表示,AlphaFold 加快了发现的速度,如今,我们每个项目都会用到它。
如今,这篇描述AlphaFold2的Nature论文已获得接近 4 万次引用。与同时期的许多其他被大量引用的生命科学和医学领域的论文不同,研究人员对 AlphaFold 的兴趣似乎并未减退。
AlphaFold2 不仅得到了全世界科学家的广泛使用,更为它的开发者John Jumper和Demis Hassabis赢得了获得了 2024 年诺贝尔化学奖。
研究人员认为,AlphaFold2 能够在全世界迅速产生影响,部分原因在于其易用性。DeepMind 向科学家们免费提供了底层代码和其他参数,很快科学家们就能够自行大规模运行该系统。
据统计,全世界有 190 多个国家的约 330 万用户(其中超过 100 万用户来自低收入和中等收入国家)访问了由欧洲分子生物学实验室-欧洲生物信息研究所(EMBL-EBI)托管的AlphaFold 数据库(AFDB),该数据库包含超过2.4 亿个蛋白质结构预测结果,涵盖了地球上几乎所有已知的蛋白质。
AlphaFold 影响最为显著的领域似乎是结构生物学。本周发布的报告显示,与未使用 AlphaFold 的结构生物学研究人员相比,使用该工具的研究人员向蛋白质数据库(PDB)提交的蛋白质结构数量高出约 50%。此外,使用 AlphaFold2 的研究人员向 PDB 提交蛋白质结构的数量也高于那些采用人工智能、结构生物学及蛋白质结构预测领域其他前沿方法的研究人员。
John Jumper表示,他特别欣慰的是,使用 PDB 数据训练的 AlphaFold2 在推断蛋白质结构方面发挥了巨大作用。预测出的结构有助于研究人员理解 X 射线晶体学和冷冻电镜产生的原始数据。很高兴 AlphaFold2 能帮助那些为我们提供数据的人。
另一个受到 AlphaFold 影响的领域是计算生物学。如果你去参加计算生物学领域的学术会议,你会发现,几乎每场报告都会提到 AlphaFold,其在包括 AI 辅助药物发现和 AI 蛋白质设计在内的计算密集型领域都有很好的应用。
在 AlphaFold2 发布后的几周到几个月时间里,从事蛋白质结构预测研究的研究人员经历了一场“存在危机”,他们一度感觉自己的主要目标已被解决。然而,AlphaFold 却很快开辟了新的研究方向——AI 蛋白质设计,并带来了新的关注和资金投入。计算生物学家不但没有被取代,现在反而可能是做计算生物学家的好时机。
此外,直接引用 AlphaFold2 或使用其预测的蛋白质数据库的科学家数量只是该工具影响力的一部分。对于 AlphaFold2 相关研究的更广泛分析显示,已有超过 20 万项研究直接或间接使用了 AlphaFold,涉及近 80 万名科学家的工作。
John Jumper表示,将 AlphaFold 的生物学洞见转化为实际应用(比如药物研发),还需要时间。2024 年发布的AlphaFold3更有助于药物发现,它能够预测潜在疗法与蛋白质的相互作用,但幕后还有很多工作要做。实际上,AlphaFold2已经开始帮助研究人员解开疾病的生物学机制,确信将会有病人因 AlphaFold2 带来的药物或疗法而治愈出院。
1. https://www.nature.com/articles/d41586-025-03886-9
2. https://www.nature.com/articles/s41586-021-03819-2
3. https://www.cell.com/cell/fulltext/S0092-8674(24)01093-6
热门跟贴