近日,AI领域新锐公司EvolutionaryScale推出了一款能够生成新型蛋白质的里程碑AI模型——ESM3。利用ESM3,研究团队生成了一种新型绿色荧光蛋白(GFP),这一过程需要5亿年的进化才能自然发生。

EvolutionaryScale成立于2023年7月,目前公司已完成超1.42亿美元的种子轮融资,领投方包括Nat Friedman、Daniel Gross、 Lux Capital,参投方包括Amazon、NVentures(英伟达的风险投资部门)等。

EvolutionaryScale的创始团队来自Meta的FAIR (Fundamental AI Research)部门,是将AI应用于生物学的先驱。该创始团队于2019年构建了ESM1——被广泛认为是第一个用于蛋白质的大型语言模型(LLM)。之后,他们曾使用ESM-2模型创建了一个包含6亿个预测蛋白质结构的免费数据库。2023年4月,相关科学家离开Meta,创办EvolutionaryScale,开发下一代生成模式——ESM3。

来源:biorxiv

ESM3在地球自然多样性的27.8亿种蛋白质的数据集上进行每秒1万亿次浮点运算的训练(比任何其他已知的生物学模型计算能力更强)。据称,这是首个同时对蛋白质的序列、结构和功能进行推理的生成式模型。ESM3有望加速广泛的应用,包括开发新的抗癌疗法。

ESM3可以联合推理蛋白质的序列、结构和功能(来源:EvolutionaryScale)

绿色荧光蛋白是唯一发光的蛋白质,已经成为分子生物学的重要工具,帮助科学家观察细胞内的分子。分析表明,在自然进化过程中,这种不同的蛋白质可能需要5亿年以上的时间才能进化出来。ESM3跨越了5亿年的进化,创造了一种新的荧光蛋白。ESM3在生成新的绿色荧光蛋白方面的成功凸显了该模型推动生物研究和生命科学领域取得进步的潜力。

ESM3先产生了B8,一种与自然界已知的所有GFP都不同的“暗淡版”GFP。从B8开始,ESM3生成了esmGFP,亮度与其他天然GFP相似(来源:EvolutionaryScale)

由ESM3产生的一种新的绿色荧光蛋白,与自然界中发现的其他荧光蛋白不同(来源:EvolutionaryScale)

EvolutionaryScale已经与Amazon Web Services (AWS)和英伟达(NVIDIA)达成了合作,加速AI在药物发现、合成生物学等领域的应用。通过与AWS合作,Evolutionary Scale使全球数十万研究人员和全球十大制药公司中的九家能够轻松访问全部的ESM3模型家族。通过与英伟达(NVIDIA)的持续合作,ESM3的所有版本都将针对训练和推理性能进行优化。

“我们的目标是,创造出可以让生物学程序化的工具。ESM3向生物学的未来迈出了重要一步。”EvolutionaryScale的首席科学家Alex Rive说道。

参考资料:

[1]https://www.businesswire.com/news/home/20240625717839/en/EvolutionaryScale-Launches-with-ESM3-A-Milestone-AI-Model-for-Biology

[2]https://www.evolutionaryscale.ai/blog/esm3-release

[3]https://www.nature.com/articles/d41586-024-02214-x

[4]https://blogs.nvidia.com/blog/evolutionaryscale-esm3-generative-ai-nim-bionemo-h100/

[5]https://www.biorxiv.org/content/10.1101/2024.07.01.600583v1

Copyright © 2024 PHARMCUBE. All Rights Reserved.

欢迎转发分享及合理引用,引用时请在显要位置标明文章来源; 如需转载,请给微信公众号后台留言或发送消息,并注明公众号名称及ID。

免责申明:本微信文章中的信息仅供一般参考之用,不可直接作为决策内容,医药魔方不对任何主体因使用本文内容而导致的任何损失承担责任。