来源:市场资讯

(来源:DrugAI)

DRUGONE

抗菌素耐药性正在迅速发展,其速度已明显超过新抗生素的发现,正在形成严峻的全球公共健康危机。传统抗生素研发周期长、成本高、成功率低,而人工智能为探索化学空间与生物空间提供了更高效的路径。研究人员系统梳理了人工智能在抗生素研究中的应用进展,包括用于筛选和优化小分子与抗菌肽的机器学习模型,以及近年来兴起的生成式模型在抗生素设计中的应用。

当前的方法涵盖蛋白语言模型用于序列与结构解析、图神经网络用于复杂分子相互作用建模,以及生成模型用于抗菌分子的从头设计。这些方法已经在计算层面显著加速了候选分子的发现,并在部分研究中实现了体外甚至体内验证。然而,仍存在关键挑战,例如数据规模有限、生物复杂性建模不足以及合成可行性约束缺失。

未来,研究人员认为需要发展面向合成可行性的设计策略、融合多组学与生物上下文信息,以及构建“模型—实验”闭环体系,以推动人工智能真正实现新一代抗生素的发现。

打开网易新闻 查看精彩图片

抗生素危机与AI机遇

抗生素的发现彻底改变了现代医学,使感染性疾病死亡率大幅下降,并支撑了器官移植、化疗及复杂手术的发展。然而,抗生素的过度使用和滥用加速了耐药性的产生,使多重耐药菌迅速扩散。

例如,碳青霉烯耐药菌、耐甲氧西林金黄色葡萄球菌等高危病原体已经对现有“最后防线”药物产生耐受。这些细菌通过多种机制实现耐药,包括药物降解、靶点突变、主动外排以及膜通透性降低,使感染治疗日益困难。

与此同时,抗生素研发进入“停滞期”。20世纪中期的“黄金时代”曾发现大量新型抗生素,但近几十年新药类别显著减少。商业激励不足与研发难度增加,使传统药物发现模式难以为继。

在这一背景下,人工智能开始成为改变抗生素发现范式的关键技术。

抗生素发现的数据资源

抗生素主要包括两大类:小分子药物和抗菌肽(AMPs)。小分子抗生素通过靶向细胞壁、核糖体或DNA复制发挥作用,而抗菌肽通常通过破坏细胞膜或调节免疫反应发挥抗菌活性。

目前,大量数据库为AI提供了基础数据来源。小分子方面,包括DrugBank、ChEMBL和PubChem等数据库,记录了药物结构、活性及靶点信息。抗菌肽方面,APD、CAMP、DBAASP等数据库收录了数千种天然或人工设计的AMP。

图1:AI驱动抗生素发现整体流程框架(数据—模型—设计—验证)。
打开网易新闻 查看精彩图片
图1:AI驱动抗生素发现整体流程框架(数据—模型—设计—验证)。

AI模型在抗生素发现中的核心任务

抗菌活性预测

AI首先被用于预测分子是否具有抗菌活性。这一任务从简单的二分类问题发展到更复杂的多标签预测,例如区分抗菌、抗病毒或抗真菌活性。此外,最低抑菌浓度(MIC)预测提供了更精细的活性评估。

毒性预测

在药物开发中,毒性评估同样关键。当前模型主要通过分类方法预测化合物是否具有溶血性或细胞毒性,从而筛除潜在风险分子。

分子生成

相比预测模型,生成模型能够直接设计新的分子或抗菌肽,显著扩展可探索的化学空间。这种从“筛选”到“设计”的转变,是AI驱动药物发现的重要范式变化。

表征方法与模型体系

抗生素分子可以通过多种方式表示,包括序列特征、结构特征以及基于语言模型的嵌入表示。近年来,蛋白语言模型(如ESM)和分子语言模型显著提升了表示能力,使模型能够捕捉复杂的生物学信息。

在建模方面,方法主要分为三类:

  • 传统机器学习方法依赖人工特征工程,计算效率高但表达能力有限。

  • 深度学习模型(如CNN和RNN)能够自动学习序列模式。

  • 图神经网络则通过分子图结构建模原子间关系,在小分子建模中表现突出。

图2:抗生素生成模型架构(VAE、GAN、Transformer、Diffusion等)。
打开网易新闻 查看精彩图片
图2:抗生素生成模型架构(VAE、GAN、Transformer、Diffusion等)。

生成式模型在抗生素设计中的应用

生成式模型正在成为抗生素发现的核心工具。其目标是从头设计具有理想性质的分子,包括高活性、低毒性及良好药代动力学特性。

模型类型包括:

变分自编码器、生成对抗网络、Transformer模型以及扩散模型等。这些模型可以进行无条件生成,也可以在特定约束下进行条件生成,例如限制电荷、疏水性或毒性。

此外,多目标优化与强化学习被引入设计过程,使模型能够同时优化多个性质。这种方法特别适合现实药物设计中的复杂需求。

不同AI方法的比较

不同模型在抗生素发现中的表现存在明显差异。

传统机器学习适用于大规模筛选任务,计算效率高。

蛋白语言模型在小数据场景下表现优异,但缺乏结构信息。

图神经网络在结构建模方面更具优势,但计算成本较高。

生成模型方面,Transformer适合抗菌肽设计,而扩散模型在小分子和蛋白结构设计中表现更优。强化学习则在多目标优化中具有重要作用。

图3:不同AI模型在抗生素发现中的性能与适用场景对比。
打开网易新闻 查看精彩图片
图3:不同AI模型在抗生素发现中的性能与适用场景对比。

AI驱动的抗生素发现流程

现代抗生素发现流程正逐步演变为“AI+实验”的闭环体系。首先,通过数据库收集数据并训练预测模型;随后进行虚拟筛选或生成设计;再通过毒性与活性模型筛选候选分子;最终进入体外和体内实验验证。

成功候选分子需要经过多轮实验验证,包括MIC测定、毒性测试及作用机制分析。这种从计算预测到实验验证的流程,大幅提升了研发效率。

图4:AI驱动抗生素发现完整工作流程(从数据到临床)。
打开网易新闻 查看精彩图片
图4:AI驱动抗生素发现完整工作流程(从数据到临床)。

实际应用与案例

AI已经在抗生素发现中取得实质性进展。例如,一些研究通过深度学习筛选数百万分子,成功发现对多种耐药菌有效的新型抗生素;另一些研究利用生成模型设计抗菌肽,并在动物模型中验证其疗效。

从文件中表格(第10–14页)可以看出,多项研究已实现从体外验证到动物模型验证的跨越,表明AI设计的分子具备实际转化潜力。

挑战与局限

尽管进展显著,AI驱动抗生素发现仍面临多重挑战。

首先是数据问题,现有数据集规模有限且质量参差不齐。

其次是生物复杂性,模型难以准确模拟体内环境。

再次是合成可行性,许多生成分子在实验中难以实现。

此外,模型偏差和泛化能力不足也限制了其应用。

未来展望

未来抗生素发现将朝着三个方向发展。

一是构建多模态模型,融合基因组、蛋白质结构及实验数据。

二是发展“可合成设计”,将化学可行性纳入模型优化目标。

三是建立闭环系统,使模型与实验形成持续迭代的反馈机制。

图5:AI驱动抗生素发现未来发展框架(闭环系统与多模态融合)。
打开网易新闻 查看精彩图片
图5:AI驱动抗生素发现未来发展框架(闭环系统与多模态融合)。

总结

人工智能正在重塑抗生素发现范式,从传统筛选模式转向生成式设计与闭环优化。虽然仍存在诸多挑战,但随着数据、模型和实验体系的不断进步,AI有望成为突破抗菌素耐药危机的关键技术。

未来的抗生素研发将不再依赖偶然发现,而是由数据驱动、模型引导、实验验证共同构成的智能化体系。

整理 | DrugOne团队