传统的药物开发通常从临床前研究中已验证的靶点和机制开始研究,但新一代初创公司将机器学习( machine learning,ML)应用于丰富的临床和分子数据集合。基于人工智能 (AI) 的算法策略可以补充假设驱动的药物靶点发现。2022年 4 月,美国生物技术公司BioAge 宣布在 Apelin 受体激动剂 BGE-105 的 Ⅰb 期临床试验中首次给药,该药物正在开发用于肌肉衰老适应症,这款药物是通过对人类衰老研究中一组患者收集的临床和组学数据进行AI分析得到的。

AI制药领域投资不断增加

Verge Genomics 利用AI发现了神经退行性疾病的新靶点,2021年12 月从礼来(Eli Lilly)和Merck GHI等投资机构那里获得了 9800 万美元的融资,计划在今年启动一项针对新靶点的肌萎缩性侧索硬化症(ALS)药物的临床试验;2022年3 月,凭借融资获得的8300 万美元资金,Celsius 启动了一项针对炎症性肠病(IBD) 的临床项目,该项目基于对患者组织样本单细胞数据进行ML分析确定的基因靶标;2022年 1 月,总部位于伦敦的 Benevolent AI 扩大了与阿斯利康(AstraZeneca)为期三年的合作范围,以应用disease-agnostic平台,该平台已经产生了至少三个新的药物靶点。

除了新锐AI制药公司,该领域早期玩家也在加强其管线。2021年 10 月, Immunai 完成了 2.15 亿美元的 B 轮融资,用于通过将 AI 应用于大量患者免疫数据来确定新的药物靶点;总部位于伦敦的 Relation Therapeutics 在 6 月份融资获得2500 万美元,用于建立一个基于 ML 的平台,该平台将单细胞分析与临床相结合,以发现治疗骨病的新靶点。

“以人为本”的筛选方法

上述这些AI制药公司的不同之处在于他们的“以人为本”的方法,重点是在患者来源的数据中识别靶点,而不是在动物模型或高通量筛选和基于细胞的分析中识别靶点。

在过去的20年里,许多药物项目受到人类基因数据的推动。这些数据大多来自全基因组关联研究(GWAS)的人群规模调查,比较患者组和健康对照组的基因特征。更重要的是,庞大的研究生物库和国家公私合作伙伴关系的兴起,为制药公司提供了充足的研究材料。比如Genomics England公司收集了15万人的表型和基因组数据,为制药公司提供了充足的研究材料。

大型生物制药公司也接受了这种方法。安进在2012年收购了冰岛初创公司deCODE Genetics,从该公司深厚的基因组专业知识和数据资源中获益,获得了包括大约50万人的基因组和临床数据。Regeneron和阿斯利康也分别通过内部研究、与学术机构的合作以及国际生物银行计划,建立了超过100万人的分子和临床数据的强大集合。

如此大规模的数据使得发现对健康和疾病有强大影响的罕见基因变异变得更加容易。但随着数据集变得越来越大,并纳入了基因组之外的其他组学(包括转录组学、蛋白质组学,甚至是代谢组学数据),所以对它们的分析变得越来越有挑战性。

这些可用于分析的数据包括与疾病相关的各种类型的数据。例如,Insitro 开发了一个基于 ML 的平台,该平台可以分析肿瘤组织病理学图像、基因组序列和临床医生报告,以识别与特定病理学相关的特征。该公司最近宣布与 Genomics England 建立合作伙伴关系,将其基于 AI 的靶点发现平台应用于他们的数据集,以促进药物目标发现。另一方面,与UK Biobank这样的数据集相关联的医疗记录(一个50万人的医疗和遗传数据库)也可以为分子数据提供支持。ML分析还可以揭示支持疾病的复杂生理通路,并提供关于为什么特定疾病患者之间存在差异的见解。

应用于药物研发各个阶段

AI分析本质上是在整个生物医学数据中“大海捞针”,以寻找关键的可操作数据。为了寻找新的药物靶点,BenevolentAI和阿斯利康梳理了实验和临床数据库,以及科学和医学文献,得到的数据被组装成“知识图”,以捕捉基因和通路之间的关系。Slavé Petrovski是阿斯利康基因组研究中心的副总裁及负责人,他开发了一种ML工具,该工具利用来自数十个生物数据库(包括人类蛋白质图谱和各种 GWAS 数据目录)的见解以及特定疾病的临床和基因组资源来破译潜在疾病大型人类数据库中的相关基因。

AI 还可以对单个细胞亚型进行分类和表征。Celsius平台分析了来自不同患者群体的单细胞转录组数据,以区分特定细胞类型中的某些基因如何与特定表型相关。这项分析发现了一种名为 TREM1 的蛋白质,它是一种细胞受体,可以选择性地抑制 IBD 中的炎症而不会广泛损害免疫功能,这种蛋白质现在是该公司的主要靶点。

结语

将计算机算法中的机器学习与药学专业知识相结合,可以为药物开发人员提供有效的工具, ML通过丰富且高质量的数据改进指定问题的发现和决策,已成为化学、生物医药等多个领域的有用工具。ML潜力巨大,相信未来能够为医药产业带来新一轮的技术革命。

本文编译自https://www.nature.com/articles/s41587-022-01457-1