对于蛋白质的计算设计和突变已获得更高效的功能一直是生物工程的核心,随着越来越多基于AI的算法出现,整个领域也在关注快速进化任何蛋白质序列的云上定性进化算法。2024年11月22日,麻省理工生物工程系姜凯议等人在Science上发表了文章Rapid in silico directed evolution by a protein language model with EVOLVEpro。本研究开发了一个新的模型EVOLVEpro,一种结合蛋白大语言模型(PLMs),主动学习和回归模型的创新蛋白质工程方法,能够在仅需少量实验数据的情况下快速提升蛋白的活性。
![](http://dingyue.ws.126.net/2024/1126/d8e006c9j00snj8xf005wd200u0009ng00hw005q.jpg)
EVOLVEpro针对当前蛋白质工程中的诸多挑战提供了解决方案,包括劳动强度大、难以多目标优化以及易受局部极值困扰。传统的基于PLM的计算方法在处理不同蛋白家族的功能改进时难以推广,而EVOLVEpro通过将PLM与回归模型结合在主动学习框架内,实现了更高效的优化。
在实验中,EVOLVEpro在12个深度突变扫描数据集上的表现显著优于现有方法,展示了其强大的基准性能。随后,研究团队将EVOLVEpro应用于六种不同的蛋白质,包括两种单克隆抗体、一种微型CRISPR核酸酶、一种编辑酶Bxb1整合酶、一种T7 RNA聚合酶和一种基因编辑器。通过使用EVOLVEpro进行优化,这些蛋白在各自应用中均实现了显著的功能提升,例如,单克隆抗体的结合亲和力提升了多达40倍,微型CRISPR核酸酶的基因编辑效率提升了5倍,T7 RNA聚合酶在转录纯度和效能上提升了100倍。
EVOLVEpro的工作原理是利用PLM来编码蛋白质序列至连续的潜在空间,通过回归模型学习蛋白活性与潜在空间的映射关系。使用主动学习策略,EVOLVEpro在每轮进化中对突变体进行排名并选择高活性候选,进行实验验证。该过程以较少的实验轮数即可实现显著的功能提升。相比于传统的定向进化,EVOLVEpro展示了在低样本数 (low-N) 环境下的优越性能,同时有效降低了成本。
在实际应用中,EVOLVEpro展示了出色的多目标优化能力。例如,在单克隆抗体CD71的优化中,模型不仅提升了抗原结合力,还改进了抗体的表达水平。通过对CRISPR核酸酶、编辑酶Bxb1、T7 RNA聚合酶等其他蛋白的优化,EVOLVEpro也展现出其对多种蛋白活性的提升潜力。
研究结果表明,EVOLVEpro是一种强大的普适性工具,可以在生物学和医学的蛋白质工程中广泛应用,尤其适用于那些难以通过高通量筛选的蛋白进化任务。EVOLVEpro通过少量实验数据和快速的计算模型推动了蛋白质活性的提升,代表着蛋白质工程领域的一次重要突破。
![](http://dingyue.ws.126.net/2024/1126/dd5667a9j00snj8xg000xd200fg00dwg00id00gi.jpg)
http://doi.org/10.1126/science.adr6006
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
BioART友情合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
会议资讯
近期直播推荐
热门跟贴