打开网易新闻 查看精彩图片

编译丨王聪

编辑丨王多鱼

排版丨水成文

自然界中的蛋白质执行着令人眼花缭乱的多种功能,这些功能是生物体非凡能力的基础。例如,蛋白质介导 DNA 和 RNA 的模板定向合成,参与光合作用中将太阳能转化为化学键能的过程,以及多细胞生物中复杂的细胞间相互作用和信号级联反应。

天然蛋白质的复杂功能是在数亿年的自然选择中进化而来的,以解决生物进化过程中至关重要的问题。然而,人类如今面临着新的问题:我们的寿命更长了,老龄化也随之而来,因此癌症和阿尔茨海默病等疾病已成为重大挑战,而且我们正在让全球变暖并造成污染。

自然界中蛋白质的显著功能性和多样性表明,新型蛋白质可能为许多此类问题提供解决方案,而且这些新型蛋白质可能在数百万年的进化和自然选择中产生,但我们没有这么多时间等待,因此人们对生成具有新功能的蛋白质产生了极大兴趣。

近日,诺贝尔化学奖得主、蛋白质设计先驱David Baker教授作为通讯作者(杨为王顺智等为共同第一作者),在国际顶尖学术期刊Nature上发表了题为:The past, present and future of de novo protein design 的综述论文。杨为博士已全职加入深圳医学科学院,任特聘研究员,成立蛋白质药物设计课题组。

该综述论文描述了从头蛋白质设计(de novo protein design)的当前状态。尽管在成功率和活动方面仍有改进的空间,但设计新型蛋白质结构、组装体和蛋白质结合剂这一长期存在的难题已接近解决。这些领域当前的关键问题不是如何设计,而是设计什么,开源设计方法如 RFdiffusion 和 ProteinMPNN 以及蛋白质结构预测工具使生物化学家和分子生物学家能够广泛探索可能的应用。在从头设计小分子靶点结合剂、酶和多态蛋白质系统方面也取得了相当大的进展。方法开发目前面临的挑战包括设计用于克服高能垒反应的催化剂,以及更广泛地说,设计将结合、构象变化和催化整合在一起的开关和纳米机器。在接下来的 5-10 年里,预计会设计出复杂的蛋白质纳米机器和材料,其功能远远超出自然进化所产生的功能,应用于医学、技术和可持续性等广泛领域。

打开网易新闻 查看精彩图片

在这篇综述论文中,David Baker团队为我们展望了一个激动人心的新时代——未来十年内,蛋白质从头设计将解决人类面临的重大难题,并在医学、可持续发展和生物技术领域发展成为一项基础性工具。我们可以利用这些工具设计出可能成为攻克癌症、阿尔茨海默病的利器,制造出高效环保的工业催化剂,甚至能组装成微小的“纳米机器”,执行特定的任务。

什么是蛋白质从头设计?

蛋白质是生命的核心执行者。从催化化学反应、传递信号到构成细胞结构,几乎所有的生命活动都离不开蛋白质。自然界的蛋白质是亿万年进化的结果,但人类面临的新挑战——例如老龄化带来的疾病、环境污染和气候变化——需要新的解决方案,而我们没有数百万年的时间去等待自然进化。

蛋白质从头设计(de novo protein design),顾名思义,就是完全从零开始,设计出具有全新结构和功能的蛋白质,而不是改造现有的天然蛋白质。这就像不是修改现有的汽车,而是从画图纸开始,设计一辆前所未有的概念车。

方法论革命:从物理模型到生成式 AI

该综述指出,蛋白质设计领域正经历一场深刻的范式转变

过去(1990 年代-2020 年):基于物理的“计算”时代

早期的计算蛋白质设计,基于“安芬森法则”(Anfinsen's dogma)——蛋白质的折叠状态是其序列的全局自由能最低状态。David Baker团队开发了 Rosetta 软件,通过复杂的物理化学力场计算,尝试寻找能折叠成目标结构的氨基酸序列。这个过程就像在巨大的可能性海洋中,用数学公式去“猜”哪个序列最稳定。虽然成功设计出了像 Top7 这样的全新折叠蛋白质,证明了概念的可行性,但整个过程耗时耗力,成功率有限。

现在(2020 年至今):基于 AI 的“生成”时代

深度学习彻底改变了游戏规则。AlphaFold、RoseTTAFold 等 AI 工具的出现,实现了从蛋白质的氨基酸序列高精度预测其 3D 结构,这为 AI 方法提供了强大的训练数据。

新一代的蛋白质设计方法,借鉴了图像生成 AI 模型(例如 DALL·E)的思路。以 RFdiffusion 为例,它就像一位蛋白质“画家”:研究人员先给模型“看”大量已知的蛋白质结构(来自蛋白质数据库 PDB),训练它学会如何从一团“噪声”中逐步还原出一个合理的蛋白质结构。训练完成后,只需从随机噪声开始,让模型反复“去噪”,就能生成全新的、合理的蛋白质骨架。这个过程可以受“条件”引导,例如,在去噪过程中始终呈现一个小分子药物的形状,模型就会生成一个能结合该药物的蛋白质口袋。

与此同时,像 ProteinMPNN 这样的工具,则专门负责为设计好的蛋白质骨架“填充”最优的氨基酸序列,确保其能稳定折叠。

生成骨架”+“设计序列”+“结构验证”,这套组合拳使得蛋白质设计变得前所未有的高效和可控。

我们已经能设计什么?

该综述论文系统梳理了蛋白质从头设计已经攻克的几大挑战,基本是按照从易到难的顺序实现的:

1、全新的蛋白质结构(单体折叠):这是基础。现在,设计一个自然界不存在的、稳定折叠的蛋白质单体,已接近成为“已解决的问题”。科学家们设计出了各种新颖的螺旋、折叠桶等结构。

2、复杂的蛋白质组装体:让多个蛋白质像乐高积木一样,自动组装成预设的对称结构(例如二十面体纳米笼)。这带来了革命性的应用——全球首款完全从头设计的药物“SKYCovione”新冠疫苗正是基于此技术(于 2022 年在韩国获批上市)。该技术正在被用于开发通用流感疫苗等。

3、蛋白质结合剂:设计能精准结合特定靶点蛋白的“分子胶水”。这为开发新一代的靶向疗法(例如针对癌症、自身免疫疾病的药物)提供了全新工具。

4、小分子结合剂与酶:设计能结合特定小分子(例如激素、药物)的蛋白质,甚至是从头设计具有催化功能的酶。目前已经成功设计出具有催化活性的水解酶、荧光素酶等,尽管其效率与天然酶还有差距。

5、多状态功能系统:这是当前的前沿领域,旨在设计能像机器一样“工作”的蛋白质系统。例如,设计一种“逻辑门”蛋白质,只在同时存在两种信号时才被激活;或设计一种“笼状”药物,只有在肿瘤微环境中才释放活性成分。

打开网易新闻 查看精彩图片

蛋白质设计的挑战及蛋白质折叠与组装的设计

打开网易新闻 查看精彩图片

蛋白质靶点的结合设计

打开网易新闻 查看精彩图片

小分子结合剂和酶的设计

打开网易新闻 查看精彩图片

具有新功能的蛋白质的设计

未来的挑战

蛋白质从头设计领域已成就斐然,但真正的“硬骨头”还在前面。该综述论文指出了几个核心挑战——

设计高能垒反应的催化剂:目前设计的酶大多催化相对简单的反应,设计能高效催化复杂、高能量障碍反应的酶(类似自然界最顶尖的酶),仍是巨大挑战。

设计整合多种功能的“纳米机器”:未来的蛋白质不应只是静态结构或单一功能分子,而应是将结合、构象变化、催化、运动等功能集成一体的智能机器。比如,能感知环境并行走的“分子机器人”,或能按序执行多步化学反应的“分子流水线”。

展望:未来五到十年

最后,David Baker团队预测,在未来五到十年,我们将看到——

1、功能远超自然进化范围的复杂蛋白质纳米机器和材料被设计出来。

2、开源的设计方法(例如 RFdiffusion、ProteinMPNN)将像今天的编程工具一样,被广大生物学家和化学家使用,极大地拓展应用探索的边界。

3、这些技术将在医学(精准疗法、疫苗、诊断)、技术(新材料、生物传感器)和可持续发展(绿色化学、碳捕获)等领域带来颠覆性应用。

蛋白质从头设计,正从一门高深莫测的科学,转变为一种强大的工程学。AI 的加入,让我们从费力地“计算”可能性,转向高效地“生成”解决方案。我们正在从一个观察和利用自然的时代,迈入一个设计和创造自然的时代。这不仅是生物技术的飞跃,更将重新定义我们解决健康、环境、能源等全球性问题的能力。

论文链接

https://www.nature.com/articles/s41586-026-10328-7