▎药明康德内容团队编辑

在人工智能迅猛发展的今天,AI算法已经能够通过人类语言的描述,按要求画出逼真的图像。比如,被称为DALL-E2的AI软件能够根据“泰迪熊在水下使用90年代的技术进行AI研究”这句话,自己生成了下面这张图片

打开网易新闻 查看精彩图片

▲这不是照片,而是AI软件根据人类语言的描述生成的图片(图片来源:DALL-E, Public domain, via Wikimedia Commons)

那这种技术能够用来开发创新药物么?比如,如果告诉AI软件我想生成抑制PD-1功能的蛋白疗法,它能够精确产生候选疗法的结构么?现在,这种想法已经不是只存在于科幻领域的想象。日前,初创公司Generate Biomedicines公司和华盛顿大学David Baker教授的课题组同日发布了各自的研究,借助DALL-E2软件基于的扩散模型(diffusion models)算法,开发的AI平台可以按照研究人员的要求精准生成自然界中没有的全新蛋白结构。Generate Biomedicines公司称其AI平台为“生物学领域的DALL-E2”,为了显示它能够按照研究人员的要求生成蛋白结构的能力,该公司的团队让这一名为Chroma的平台生成了模拟26个英文字母和10个阿拉伯数字形态的全新蛋白结构。

打开网易新闻 查看精彩图片

▲Generate Biomedicines公司的Chroma平台能够根据对蛋白形状的要求设计出全新蛋白结构(图片来源:Generate Biomedicines公司官网)

利用AI进行蛋白设计今年已经获得多项突破,David Baker教授的课题组今年3月再《自然》发表重磅论文,介绍了能够基于靶点蛋白结构,设计与之紧密结合的候选蛋白药物的新技术。今年9月,该团队又在《科学》杂志连发两篇论文,利用名为ProteinMPNN的全新深度学习工具,从头设计出全新功能性蛋白分子,并且将设计蛋白的时间从“月”缩短至“秒”。不过,此前的蛋白设计策略仍然可能需要对成千上万的候选分子进行检测,才能发现最终符合预先要求的分子。

在发布的最新研究中,两个团队利用了扩散模型算法,这种算法是一种神经网络,它通过训练可以清除输入数据中的噪音。如果输入的数据是随机的一团像素,扩散模型能够将它转变成为人眼能够识别的图像。将它应用于蛋白设计上,研究人员可以根据靶点的结构,让AI算法把原先无序和混乱的氨基酸残基,通过不断地除噪运算,最终拼接成能够和靶点结合的候选蛋白。

打开网易新闻 查看精彩图片

▲David Baker课题组开发的AI平台(名为RF diffusion)可以生成与靶点结合的创新蛋白(图片来源:参考资料[2])

David Baker的团队指出,与此前的蛋白设计程序相比,RF diffusion在解决不同设计挑战方面的表现都更为优越。它能够设计更为大型和复杂的蛋白,以及可以相互结合形成多聚体的蛋白单体。

打开网易新闻 查看精彩图片

▲这一平台可以设计出形成多聚体的蛋白,与由多个亚基组成的靶点蛋白结合(图片来源:参考资料[2])

尤为重要的一点是,在蛋白设计过程中,研究人员可以对蛋白的特性提出各种不同的要求,而AI模型会根据这些要求设计出相应的结构。这让计算机完成的设计过程能够产出最符合设计要求的蛋白结构,提高“一步到位”的可能性。Baker团队的文章指出,在有些蛋白设计项目中,研究人员发现只需要在实验室中检验计算机设计一个候选蛋白,就发现了符合所有设计标准的蛋白。团队已经设计出能够与PD-L1、IL-7Rα、胰岛素受体、TrkA受体、和血凝素结合的蛋白结构。该团队设计的与甲状旁腺激素结合的蛋白亲和力达到纳摩尔以下。

Generate Biomedicines公司联合创始人兼首席科技官Gevorg Grigoryan博士表示,这一技术好比学会了如何使用蛋白的语言进行书写,它将给新药开发带来革命性的影响。这意味着我们不再依赖大自然进化的产物发现非最佳选择,而是可以根据指定的需求,创造和生成高度有效的药物。”他说。

如您有任何业务需求,请长按扫描上方二维码,或点击文末“阅读原文/Read more”,即可访问业务对接平台,填写业务需求信息

▲欲了解更多前沿技术在生物医药产业中的应用,请长按扫描上方二维码,即可访问“药明直播间”,观看相关话题的直播讨论与精彩回放

参考资料:

[1] Biotech labs are using AI inspired by DALL-E to invent new drugs. Retrieved December 2, 2022, from https://www.technologyreview.com/2022/12/01/1064023/biotech-labs-are-using-ai-inspired-by-dall-e-to-invent-new-drugs/

[2] A diffusion model for protein design. Retrieved December 2, 2022, from https://www.bakerlab.org/2022/11/30/diffusion-model-for-protein-design/

[3] Generate Biomedicines Uses AI to Create Proteins That Have Never Existed. Retrieved December 2, 2022, from https://www.businesswire.com/news/home/20221201005267/en/Generate-Biomedicines-Uses-AI-to-Create-Proteins-That-Have-Never-Existed

[4] Chroma. Retrieved December 2, 2022, from https://generatebiomedicines.com/chroma

[5] Illuminating protein space with a programmable generative model. Retrieved December 2, 2022, from https://cdn.generatebiomedicines.com/assets/ingraham2022.pdf

[6] Broadly applicable and accurate protein design by integrating

structure prediction networks and diffusion generative models. https://www.bakerlab.org/wp-content/uploads/2022/11/Diffusion_preprint_12012022.pdf

免责声明:药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的,文中观点不代表药明康德立场,亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导,请前往正规医院就诊。

版权说明:本文来自药明康德内容团队,欢迎个人转发至朋友圈,谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权请在「药明康德」微信公众号回复“转载”,获取转载须知。