药物开发中的低成功率可能令人望而生畏,但随着人工智能开始聚焦于最有前景的候选药物,这个问题可能会变得不那么严重了。
当Insilico Medicine(英矽智能)的首席执行官Alex Zhavoronkov博士及其合著者在2023年撰写了关于AI驱动的目标发现的观点文章时,他们思考的是目标发现经常被误解的情况。根据他们的经验,大多数大型制药或生物技术公司已经有了选择治疗目标的方法,并且在某些情况下,他们已经知道应该追求哪些目标。他们在目标发现解决方案中寻求的是确认和支持。
△Alex Zhavoronkov博士
据GEN杂志报道,Alex Zhavoronkov博士表示,像选择投资股票一样,制药公司希望确保他们追求的目标是正确的。他们还需要知道何时行动起来。如果行动太早,没有人会购买;如果行动太晚,其他人都会有相应的药物。因此,需要保持平衡。
考虑到将药物从发现阶段经过临床试验并获得监管批准所需的巨大投资,以及90%的药物在临床试验中失败的常见统计数据,这种立场是可以理解的。大型制药公司可能有足够的资源去冒险选择全新的目标,但对于规模较小的公司来说,如果他们选择的候选药物失败,将会面临更大的风险。
01希望的崛起
鉴于药物研发的挑战,制药公司合理地选择投资于他们相信能够提高成功率或降低成本的解决方案。DeepMind的AlphaFold蛋白质结构预测软件以及OpenAI的ChatGPT等生成式AI工具的成功,增加了科学家对AI作为下一个重大药物发现技术的兴趣和信心。
在当今的科学会议上,AI成为了热门话题。Cresset Biomolecular Discovery的首席技术官Timothy Cheeseright博士在波士顿举行的今年的Bio-IT World Conference期间的一次对话中告诉记者,大型语言模型等某些形式的AI可以帮助药物化学家和生物学家更高效地工作。事实上,Cresset公司正在努力将生成式AI整合到其药物设计解决方案的产品组合中,并最近从微软聘请了应用大型语言模型的专家Mutlu Dogruel博士来推动其战略。
毫无疑问,当前对AI兴趣的推动因素之一是生物医学研究数据集的多样性和规模。作为一名神经科学家,Jonathan Witztum博士对大数据问题非常了解。他现在担任总部位于韩国南部并在纽约设有办事处的AI药物发现公司Syntekabio美国子公司的首席技术官。但他以前在一个神经科学实验室工作,产生了大量的大脑和行为图像和视频,这迅速超过了常规分析技术的能力。他说,科学界“非常擅长收集大量的数据。”他补充说,AI技术是“处理大量数据的一种非常快速且一致的方法”。
在AI的帮助下,发现药物的潜力也变得更加可观。使用AI驱动的药物发现公司,如BenevolentAI、Insilico Medicine和Recursion Pharmaceuticals,已经将候选药物带入临床试验阶段,尽管这些候选药物能否获得批准还有待观察。最近的一项分析发现,截至2023年12月,“24种AI发现的分子已经完成了一期临床试验,其中22种成功率达到80-90%。同样的分析还发现,截至去年底,AI发现的10种分子已经完成了二期临床试验,成功率为40%。这些数据表明,AI在药物发现方面具有巨大的潜力。
△Cresset Biomolecular Discovery的计算化学解决方案和服务可以加速药物发现。例如,该公司最近发布了其Flare药物发现平台的最新版本,旨在改进配体和基于结构的药物设计和优化。Flare可以与Cresset的KNIME分析平台集成,以实现配体比较和研究、对接和评分实验、三维模型构建以及新分子设计的评分。
02挥之不去的疑虑
然而,AI是否能够实现预期的效果仍然是一个未知数。许多科学家认为,在药物发现领域,需要谨慎宣传AI的好处,并找出哪些技术对药物发现最有效。虽然AI已经成为一种不可或缺的存在,并在某些应用领域表现出良好的效果,但仍然需要进一步的研究和验证。
不同形式的AI对药物发现的影响程度是不同的。虽然科学家多年来一直在使用机器学习等AI的分支进行药物发现,但应用深度神经网络等技术需要大量的数据,而这些数据在临床前研究中并不存在。
此外,AI模型并非神奇的存在。无论算法多么智能,它仍然是人造的,可能会出错。因此,仍然需要进行复杂的测试和验证实验,以确保药物和目标的结合符合预期,安全且具有足够的亲和力,可以转化为新药。纯粹的计算方法是否能够准确预测化合物的成功,仍然是一个需要进一步研究的问题。
03潜在的解决方案
曾经只在学术界和特定科学会议上讨论的算法现在已经远远超越了这些领域。制药公司正在大举投资,旨在将AI整合到他们的流程中。无论是因为巧妙的重新包装还是有意的投资,越来越多的软件和服务公司声称几乎在药物发现的各个方面都有基于AI的解决方案。例如,目标识别的解决方案涵盖了从机器学习到生成式AI的各种方法。通过这些解决方案,模型使用各种组学数据以及药物-靶标相互作用信息、临床试验、药代动力学预测、文本数据等进行广泛的训练,以捕捉基因、蛋白质、途径和药物之间的关系。
例如,AstraZeneca(阿斯利康)与BenevolentAI合作,为慢性肾脏病和特发性肺纤维化寻找新的靶点。还有像Atomwise这样的公司,他们的基于AI的软件AtomNet使用基于结构的药物设计来寻找蛋白质靶点的新型小分子。像Insilico Medicine这样的公司也已经将通过AI发现的临床前候选药物授权给制药公司,获得了巨额回报,Insilico Medicine的回报高达数亿美元。
△Atomwise利用人工智能进行基于结构的药物设计技术,旨在帮助科学家预测小分子与目标蛋白质的结合情况。该技术还可以减少对经验筛选的依赖。该公司声称其技术可以筛选数十亿个化合物,并已经在同源建模蛋白质上取得了成功。
此外,Zhavoronkov的公司还提供一种基于AI的目标发现解决方案PandaOmics,它结合了多达60个学习模型,形成一个“模型团队”,如Zhavoronkov所说。这些模型可以独立工作或协同工作,绘制出蛋白质靶点的详细图像。他说:“关键是,不要只信任一种方法。你需要看很多很多方法。”
对于目标发现,PandaOmics的模型从基因表达、疾病关联、甲基化、蛋白质组学和微小RNA数据中学习,还包括来自已发表文献和其他资源的文本数据,以识别目标。它涵盖的信息范围很广,包括500万个组学数据样本、300万个资助、近400万个专利、3000万篇出版物以及130万个化合物和生物制剂。它还包括一个类似于ChatGPT的大型语言模型,促进研究人员与平台之间的对话。
对于特定的疾病或疾病,该系统根据目标的新颖性、对目标潜力的信心程度以及目标的商业可行性等因素对蛋白质靶点进行优先排序。用户还可以评估与药物可药性相关的信息,包括蛋白质靶点的结构、药物结合能力以及对小分子或抗体的可及性。用户还可以探索每个目标的支持数据类型,包括每个实验数据集中包含的样本数量、先前研究中使用的平台以及与目标相关的任何试验数据。甚至可以查看在生成数据集中投资了多少资金以及复制类似研究所需的成本。
△Insilico Medicine 开发了 PandaOmics,这是一个基于云的软件平台,将人工智能和生物信息学技术应用于多模态组学和生物医学文本数据,以发现治疗靶点和生物标志物。在最近的一篇论文中,该公司的科学家介绍了几个案例研究,验证了 PandaOmics 的靶点识别能力(Kamya et al. J. Chem. Inf. Model. 2024;doi:10.1021/acs.jcim.3c01619)。
Insilico Medicine于两年前推出了PandaOmics。自那时以来,该平台已经被数千名用户尝试过。Insilico继续寻找扩展PandaOmics功能的方法。Zhavoronkov表示,其中一些扩展计划是通过与学术界的互动而产生的。事实上,PandaOmics在一定程度上受到了Open Targets的启发,Open Targets是一个由学术界和制药合作伙伴组成的联盟,开发了一个基于AI的开放平台,用于识别和优先选择药物靶点。Zhavoronkov指出:“如果社区提出了想法,并且我们认为其中一种方法很有趣,我们会在获得必要许可的情况下将其添加到平台上。”
在药物发现的后续阶段,还有一些公司,如Syntekabio,专注于寻找和测试适用于临床开发的可行候选药物。当该公司于2009年成立时,计划为新生儿提供罕见突变检测服务。但后来,它转向了药物发现市场,并对AI的潜力抱有很大的期望。值得注意的是,运行基于AI的算法所需的计算能力并不是微不足道的。Syntekabio通过建立一个计算中心进行了大量的基础设施投资,目前拥有约5000台服务器,并计划在不久的将来将其扩展到10000台服务器。Syntekabio计划到2026年建立至少两个类似的中心,这意味着它将拥有总共30000台服务器来支持其计算需求。
虽然AI在药物研发领域的应用前景广阔,但科学家们仍然需要谨慎对待,并找出最适合药物发现的技术。AI的发展仍处于起步阶段,需要进一步的研究和验证。然而,随着数据集的不断增大和技术的不断进步,AI有望在药物研发中发挥越来越重要的作用,加速新药的发现和开发过程。
编辑|王洪
排版:李丽
参考资料:Pun FW、Ozerov IV、Zhavoronkov A。人工智能驱动的治疗靶点发现。Trends Pharmacol. Sci。2023;44(9):561–572。DOI:10.1016/j.tips.2023.06.010。
Jayatunga MKP、Ayers M、Bruens L 等人。AI 发现的药物在临床试验中有多成功?初步分析和新经验。药物发现。今日2024;29(6):104009。DOI:10.1016/j.drudis.2024.104009。
热门跟贴