抗菌素耐药性(AMR)已成为全球健康的严重威胁,仅2021年就报告了数百万相关死亡病例。开发新型抗生素以绕过耐药性,或利用联合疗法恢复现有抗生素疗效,是当前的主要策略。然而,新抗生素的发现愈发困难。宿主防御肽(HDPs)及其模拟物——聚合物抗生素,因其可破坏细菌膜、调节免疫等特点而备受关注,但其临床转化受限于毒性、稳定性和成本。聚合物抗生素的设计空间广阔,但传统的发现方法依赖经验试错,效率低下。尽管深度学习在抗菌肽发现中取得进展,但由于聚合物数据稀缺、结构多样且分子表征复杂,其在聚合物抗生素领域的应用仍然有限。

针对这一挑战,浙江大学计剑教授张鹏研究员团队开发了一个名为PolyCLOVER的深度学习框架。该框架整合了多阶段自监督学习、主动学习和高通量实验,能够在无需依赖外部标记数据集的情况下,高效探索广阔的聚合物化学空间,迭代发现具有强效抗菌活性和低毒性的聚合物抗生素。应用于一个包含约10万个聚(β-氨基酯)的组合库中,该框架成功发现了三种先导化合物,它们能自组装成稳定的纳米颗粒,对多重耐药的金黄色葡萄球菌和鲍曼不动杆菌表现出优异的抗菌活性,并能作为抗生素佐剂载体,恢复细菌对青霉素G的敏感性。体内研究证实了其单独或联合用药的治疗效果。相关论文以“Iterative discovery of potent polymeric antibiotics via multi-stage and multi-task learning against antimicrobial resistance”为题,发表在

Nature Communications
上。

打开网易新闻 查看精彩图片

研究团队首先构建了一个包含约10万种聚(β-氨基酯)自组装纳米颗粒(SANPs)的组合库(图1b)。他们从库中随机选取220个样本进行实验,测试其抗耐药金黄色葡萄球菌活性和溶血性,形成了初始数据集。结果显示,在庞大的库中通过随机采样找到高效低毒SANPs的概率极低(图2b),凸显了机器学习辅助设计的重要性。为了在数据有限的条件下提升模型性能,研究采用了图神经网络,并创新性地引入了两阶段自监督预训练策略(图2d)。首先在大规模未标记通用聚合物数据上预训练,然后在目标聚(β-氨基酯)库上持续预训练,最后在小规模标记数据上微调。可视化分析表明,预训练后的模型能更好地捕捉聚合物结构特征,在潜空间形成清晰聚类(图2e)。与基线方法相比,该策略显著提升了预测性能(图2f, g),为后续优化奠定了坚实基础。

打开网易新闻 查看精彩图片

图1 | PolyCLOVER概览。 a, PolyCLOVER工作流程。基于构建的库,通过两阶段多任务自监督学习预训练图编码器。从库中采样初始子集,通过高通量合成及抗菌活性和溶血率表征生成标记数据集。随后微调图编码器,形成由20个基础学习器组成的集成预测器。预测器评估库中未标记SANPs的活性和预测不确定性,通过UCB采集函数和K-Means聚类指导迭代选择新候选物。此过程循环迭代。b, 组合库构建。该库基于二丙烯酸酯和胺单体的迈克尔加成反应构建。根据溶解度和成本,从市售来源中选择了8种二丙烯酸酯和38种胺,包括16种带有叔胺侧基或Boc保护伯胺基的胺、16种带有疏水侧基的胺和6种带有亲水侧基的胺。控制B、C、D的比例在适当范围内以驱动自组装,形成约10万种聚(β-氨基酯)SANPs。c, 体外/体内验证。进行了额外的体外实验以表征所选SANPs的详细抗菌活性、细胞毒性和粒径。在肺炎和腹膜炎模型中验证了SANPs单独或与青霉素G联用的体内治疗效果。

打开网易新闻 查看精彩图片

图2 | 模型训练与评估。 a, 初始标记数据集中不同类型构建块的数量。构建块ID对应的结构见补充表1。b, 初始数据集中抗菌活性和溶血特性的分布。顶部和右侧轴的边缘直方图显示各属性的分布。等高线使用核密度估计绘制,阈值为0.15。坐标轴数值越低表示抗菌活性越强、血液相容性越好。c, 不同骨干网络在抗菌和溶血特性上的平均测试性能。报告了三次独立运行的测试均方根误差平均值。d, 数据预处理和模型架构。图Transformer依次在未标记聚合物数据集和构建的未标记纳米颗粒数据集上进行预训练,以学习丰富的结构特征。然后使用标记的纳米颗粒数据集进行微调,以预测抗菌和溶血特性。e, 由预训练和未预训练的图编码器生成的表征的t-SNE可视化。每个数据点根据所用二丙烯酸酯的类型着色。f, 所提方法的测试性能。为便于在雷达图上可视化,皮尔逊相关系数显示为1-R,其中封闭区域越小表示性能越好。报告了三次独立运行的测试均方根误差平均值。g, 所提模型的测量值与预测值关系图。虚线代表理想情况(y = x)。右下角显示皮尔逊相关系数。

PolyCLOVER的核心是一个基于贝叶斯优化的主动学习工作流(图1a)。它利用集成预测器评估库中剩余未标记SANPs的活性与不确定性,通过上置信界采集函数平衡探索与利用,并结合K-Means聚类筛选出每一轮待实验验证的候选者(图3a)。经过多轮迭代,模型引导的筛选使得候选聚合物的抗菌活性不断增强,溶血毒性持续降低(图3b-d)。优化过程也揭示了关键结构特征的趋势,例如疏水性和正电荷比例的变化(图3e, f),以及特定构建块(如B10和C16)的出现频率增加(图3g)。最终,从库中成功筛选出多个满足高效低毒标准的候选SANPs(图3h)。

打开网易新闻 查看精彩图片

图3 | 基于贝叶斯优化的主动学习过程。 a, PolyCLOVER筛选SANPs各步骤所耗时间。b, c, 每一轮中抗菌(b)和溶血(c)特性的热图。d, 每一轮中抗菌和溶血特性的密度图。数值越低代表抗菌活性越好、血液相容性越佳。每轮包含 n = 60 个(初始轮 n = 220)结构不同的样本。等高线显示核密度估计,白点为中位数,粗条为四分位距,细线为95%置信区间。此可视化方案也用于(e)和(f)。e, f, 平均LogP (e) 和正电荷比例 (f) 在迭代优化轮次中的演变。每个纳米颗粒的LogP值根据其构建块的组成比例加权计算得出。g, 各构建块在迭代优化轮次中的出现频率。框内插图显示B10和C16的结构。h, 满足标准的SANPs的最低抑菌浓度值和选择性指数。虚线上方的样本代表MIC大于 32 μg/mL。选择性指数计算为 HC50 与 MIC 的比值。

在发现的候选物中,三种命名为H1、H2和H3的SANPs脱颖而出(图4a)。它们由特定的二丙烯酸酯和胺类单体以特定比例构成,能自组装成粒径约100纳米、带正电的纳米颗粒(图4b)。体外实验表明,三者均对耐药金黄色葡萄球菌具有强效杀菌活性,其中H3杀菌速度极快,4分钟内即可杀灭90%的细菌,远超需要数小时起效的链霉素(图4c, e)。更重要的是,这些SANPs不易诱导耐药性产生,在28天传代实验中其最低抑菌浓度仅轻微波动(图4f)。它们对一系列临床分离的耐药革兰氏阳性菌(包括MRSA、VISA等)有效,但对大多数革兰氏阴性菌活性有限,显示出选择性抗菌谱(图4g)。机制研究表明,这些SANPs通过快速破坏细菌细胞膜发挥杀菌作用,透射电镜观察到了明显的膜解体(图4h),活/死细菌染色和膜电位探针实验也证实了其膜靶向特性(图4i, j)。分子动力学模拟进一步揭示了SANPs通过静电作用吸附并破坏细菌膜的过程(图4k)。

图4 | 已发现SANPs的结构、体外抗菌活性及抗菌机制。 a, 所选已发现SANPs(H1, H2, H3)的详细信息,包括分子结构、单体比例、MIC值和溶血毒性。b, 已发现SANPs的粒径分布、Zeta电位和TEM图像。比例尺:1 μm。c, SANPs和链霉素在 32 μg/mL 浓度下孵育 9 小时的杀菌性能。使用单因素方差分析进行统计分析。d, 已发现SANPs在胰蛋白酶大豆肉汤和胎牛血清中MIC值的变化。e, 已发现SANPs和链霉素在 32 μg/mL 浓度下100分钟内的杀菌动力学。f, MRSA在TSB培养基中传代28天后对已发现SANPs和链霉素的耐药性演变。g, 已发现SANPs对3种参考菌株和11种临床分离耐药病原体的MIC值。革兰氏阳性和阴性菌分别显示在左右两侧。每个测试进行了三次独立实验。h, MRSA与已发现SANPs在 64 μg/mL 浓度下孵育 10 分钟后的TEM图像。比例尺:200 nm。i, MRSA与已发现SANPs在 64 μg/mL 浓度下孵育 15 分钟后的活/死细菌染色。对照:仅用PBS处理;未使用抗菌剂。比例尺:20 μm。j, 已发现SANPs和链霉素在 64 μg/mL 浓度下诱导膜电位破坏的荧光分析。使用单因素方差分析进行统计分析。k, H2与细胞膜相互作用的分子动力学模拟。

在小鼠急性肺炎模型中,静脉注射H1、H2或H3均能显著降低肺部细菌载量,疗效与链霉素相当,并有效缓解肺部感染和组织损伤,且未表现出明显组织毒性(图5a-d)。荧光标记实验显示,注射后SANPs主要集中在肝脏和肺部,表明其能有效递送至感染部位(图5e, f)。

打开网易新闻 查看精彩图片

图5 | 已发现SANPs在体内治疗急性肺炎的疗效。 a, 小鼠急性肺炎模型构建和治疗方案示意图。第0天,用异氟烷麻醉小鼠,气管内接种MRSA菌悬液以诱导感染。第1天,通过尾静脉注射给予已发现的聚合物H1、H2、H3和链霉素,剂量为 5 mg/kg。第2天,处死小鼠,取出肺脏进行形态学观察。肺组织匀浆用于细菌菌落计数。b, 小鼠肺部外观视觉检查及组织匀浆细菌培养以评估感染。c, 通过菌落计数对感染小鼠肺细菌载量进行量化。d, 使用H&E、Masson和CD68染色对肺组织进行组织学分析,以评估组织损伤、纤维化和炎症程度。比例尺:300 μm。e, f, SANPs在小鼠体内分布的定量结果及荧光成像,以确定组织靶向效率。

除了固有的抗菌活性,这些SANPs还展现出作为抗生素佐剂的巨大潜力。棋盘实验表明,它们与青霉素G(PG)具有显著的协同作用,尤其是H2与PG的复合物(图6a)。H2能高效包裹PG,形成稳定的纳米复合物,几乎完全封装药物,载药率接近50%(图6b)。分子模拟证实了二者之间存在静电相互作用(图6c)。在致命的MRSA腹膜炎模型(图6d)中,单独使用PG疗效甚微,而H2-PG纳米复合物则表现出与链霉素相当的强大抗感染效力,能大幅降低各器官的细菌载量和炎症因子水平,并改善组织病理损伤(图6e-h)。急性毒性评估表明H2及其复合物具有良好的体内安全性。

打开网易新闻 查看精彩图片

图6 | 已发现SANPs恢复MRSA对青霉素G敏感性的体外机制验证及体内疗效评估。 a, 棋盘实验评估已发现SANPs与青霉素G对MRSA的抗菌协同作用。右上角显示FICI值。b, SANPs-PG纳米复合物的表征,包括粒径分布、形态、包封效率和载药量。c, H2与PG组装过程的分子动力学模拟。d, 致命性MRSA腹膜炎模型及相应治疗策略示意图。第1天和第3天腹腔注射环磷酰胺以诱导免疫抑制。第4天,腹腔感染MRSA。感染后,腹腔注射给予H2、PG、链霉素、H2-PG纳米复合物或PBS对照。24小时后处死小鼠,收集血清和组织样本。e, 肝组织匀浆培养的细菌菌落平板图像。f, 肝、肾、脾、肺组织中细菌载量的量化。g, 小鼠血清中炎症细胞因子的浓度。h, 肝、肾、脾、肺切片的H&E染色组织学分析。比例尺:300 μm。

综上所述,PolyCLOVER框架成功实现了在无需外部数据集的情况下,于超大聚合物化学空间中高效发现兼具强效抗菌活性和低毒性的新型聚合物抗生素。这些抗生素不仅能直接杀菌,还能作为载体恢复耐药菌对传统抗生素的敏感性。该研究采用的跨导式多阶段学习策略,为数据稀缺条件下的大规模化学库筛选提供了高效范式。更广泛地看,PolyCLOVER作为一个可推广、可扩展的平台,不仅适用于聚(β-氨基酯),未来还有望扩展到其他聚合物骨架和复杂拓扑结构,通过与内部实验数据的持续交互,在大化学空间内实现功能聚合物的自主进化与设计,为下一代智能化、自适应聚合物生物材料的发现提供了蓝图。