随着包括多种非动物方法在内的新方法学(NAMs)的出现,毒理学领域正经历一场范式转变。这一转变主要源于传统动物毒性测试在评估人类健康风险方面存在局限性,亟需寻求突破。
在过去5年中,以“NAMs”为唯一关键词在PubMed上检索,可获得近1000篇相关文献,数量从2020年的156篇增长至2024年的近两倍。这些研究大多表明,NAMs有望减少对动物试验的依赖,并可能更准确地预测化合物在人体中的反应。全球监管机构也在鼓励在监管场景中探索使用NAMs:FDA在2025年4月发布的路线图中明确提出,通过强调使用NAMs逐步淘汰动物测试;2022年签署生效的《FDA现代化法案2.0》也鼓励采用动物测试替代方法,以推进“3R原则”(替代、减少、优化)。
目前,各类NAMs已得到积极开发或评估,包括计算机模拟方法、体外测试、高通量与高内涵筛选、组学技术以及微生理系统(MPS,如器官芯片)等。尽管人们已讨论过各类NAMs的相对优势,但缺乏基于常见药物对不同NAMs进行的公正、直接对比研究。
药物性肝损伤(DILI)是药物安全性的重要关注点,是导致药物撤市和研发终止的主要原因。近50%因DILI在临床试验或上市后监测中失败的药物,其风险未被临床前动物研究预测到。因此,DILI已成为NAMs(尤其是体外NAMs)研究最广泛的终点之一。
鉴于目前有多种体外NAMs用于DILI预测,一个核心问题随之产生:这些方法(无论是单独使用还是联合使用)是否已具备条件,可作为动物研究的可行替代方案,用于DILI评估以支持药物研发乃至监管应用?
FDA将体外NAMs与动物模型(传统方法)、微生理系统(MPS,目前最复杂的NAMs)进行了对比分析,同时也对不同NAMs方法进行了比较,旨在评估它们在人类DILI评估中的相对表现。
体外NAMs与动物模型的对比
为评估体外NAMs作为动物试验替代方案的潜力,FDA将6种体外NAMs与3项基于动物数据的研究进行了对比。
主要对比了预测人类DILI的表现,结果如下图所示。体外NAMs的准确性介于54%至93%之间,而动物试验的准确性仅为37%至44%。初看之下,体外NAMs的表现通常优于动物模型,这与此前多项研究结论一致。
以上数据有一定局限性,主要体现在共同药物数量有限。体外NAMs与动物研究之间的对比仅涉及少量共同药物,有时甚至不足5种,这可能导致两者可比性评估出现偏差。
为实现客观比较,FDA完全基于体外NAMs与动物测试之间的共同药物进行分析。FDA主要参考了Fourches等人的研究,该研究同时提供了啮齿类(大鼠、小鼠、豚鼠)和非啮齿类(犬、猴、猪)动物数据。为与监管毒理学中常用的主要动物模型保持一致,FDA聚焦于啮齿类动物数据。
如下表所示,仅2种体外NAMs(HepG2_Pfizer和Spheroids_AZ)的准确性与动物模型相当或更高,其余4种表现更差。体外NAMs与动物模型在DILI分类上的一致性差异显著,介于18%至66%之间。需注意的是,这些发现受限于体外NAMs与动物研究之间重叠化合物数量有限。
值得注意的是,HepG2_Pfizer和Spheroids_AZ均采用多参数进行DILI分类,前者采用HCS细胞参数、细胞核计数、DNA含量、钙(含量/水平)、线粒体膜电位、质膜通透性等参数,后者采用细胞毒性IC50、BSEP、THP1、Glu、cLogP、Cmax等参数。这些多参数方法在预测人DILI结果时,表现与动物评估相当甚至更优。可能的解释是:DILI是一种多因素疾病,准确评估需依赖能适当涵盖多种潜在机制的方法。这也暗示了单独使用单终点检测评估复杂毒性的局限性,单终点检测可能仅与特定DILI机制相关,无法识别由其他途径引起的损伤,导致评估药物整体DILI风险的预测能力下降。例如,聚焦线粒体毒性的检测可为识别通过线粒体功能障碍引发肝损伤的药物提供有价值信息,但无法准确分类通过胆汁酸稳态紊乱导致DILI的药物。
因此,有研究认为,针对特定机制的NAMs应联合使用以实现全面的DILI评估。这些多参数方法整合了线粒体功能障碍、细胞活力、氧化应激等多种机制终点,从而广泛覆盖了导致DILI的通路。在此背景下,基于多参数的检测(如可捕捉这些多种机制终点的“细胞绘画(cell painting)”技术)有望成为有效的DILI体外NAMs。
假阴性率与假阳性率的对比及应用启示
为了解NAMs在药物研发中的应用价值,比较了体外NAMs与动物模型的假阴性率(FNR)和假阳性率(FPR)。FNR指人类DILI阳性药物被模型错误预测为阴性的比例。FPR指人类DILI阴性药物被模型错误预测为阳性的比例。这两个指标对药物候选物的筛选决策至关重要,高假阴性率可能因推进失败候选物而增加成本;高假阳性率则可能导致潜在候选药物的错失。
结果很有意思,体外NAMs的假阴性率普遍高于动物模型。动物模型的假阳性率则始终高于所有体外NAMs。如果企业优先目标是减少后期研发失败,避免高成本付出,动物模型可能更有效,因为它“宁可错杀,绝不放过”。若目标是避免过早淘汰有潜力的候选物,体外NAMs可能是更好的选择。
微生理系统(MPS)与体外NAMs的比较
MPS试图模拟肝脏等人体器官的结构和功能,为研究药物效应提供具有生理相关性的平台。包括肝芯片技术在内的近期研究均显示了MPS在DILI评估中的潜力,但在DILI预测方面,其相较于体外NAMs的比较优势仍不明确。
Ewart等人的研究是目前公开可得的最大规模MPS-DILI研究(以下简称“MPS_Emulate”)。FDA将6种体外NAMs与该研究进行了对比。通过对具体药物预测情况的分析,发现了以下关键结果:
托卡朋与曲格列酮:MPS_Emulate和大多数体外NAMs(6种检测中的5种)均正确将其预测为DILI阳性。托卡朋曾用作帕金森病的辅助治疗药物,后因肝毒性被撤市。
左氧氟沙星:包括MPS_Emulate在内的大多数NAMs均一致将其错误分类。左氧氟沙星是一种氟喹诺酮类抗生素,可通过特发性方式引起肝损伤。尽管并非所有体外NAMs都分析了该药物,但纳入分析的NAMs(包括MPS_Emulate)均对其做出了错误预测。
希美加群:MPS_Emulate正确将其预测为DILI阳性,但大多数体外NAMs未能做到。希美加群是一种口服直接凝血酶抑制剂,因肝毒性被撤市。6种体外NAMs中有4种分析了该药物,其中3种对其做出了错误分类。
他克林:大多数体外NAMs正确将其预测为DILI阳性,但MPS_Emulate未能做到。他克林是首个获FDA批准的阿尔茨海默病治疗药物,因肝损伤风险过高而停用。5种分析了该药物的体外NAMs中,有4种正确将其识别为DILI阳性,而MPS_Emulate则预测失误。
MPS通常被视为更先进的NAMs形式,FDA原本期望通过分析揭示其相较于传统体外NAMs的潜在优势。然而,由于MPS_Emulate模型中测试的化合物和药物与体外NAMs的重叠数量有限,目前的数据尚无法有效评估MPS与体外NAMs在何种情况下更适合评估DILI风险。
FDA推测,没有任何一种NAMs能在所有药物的DILI预测中表现最优,这也强调了在药物安全性评估中采用互补方法以提升预测性能的重要性。
体外NAMs之间的两两比较
为明确体外NAMs在测试药物的重叠数量及DILI分类一致性方面的异同,FDA对其进行了两两比较,结果如下图所示。
不同检测之间的共同测试药物数量差异显著:多数情况下不足50种,仅Spheroids_AZ研究与Spheroids_Genentech研究的共同药物达到77种。不同实验室间测试药物的重叠数量有限,为得出具有统计显著性的结论带来挑战。实践中,此类比较通常需要至少50个配对样本才能获得可靠估计。
此外,DILI分类标准不一,一致性差异显著。体外NAMs之间的DILI分类一致率(即两种研究在所有共同评估药物中分类结果相同的比例)差异较大,介于21%至92%之间。
另外,易致DILI的治疗类别未得到充分覆盖。研究表明,DILI在某些治疗类别中高发,如心血管系统药物、全身用抗感染药、抗肿瘤药及免疫调节剂、肌肉骨骼系统药物和神经系统药物。因此,用于DILI评估的NAMs应充分覆盖这些易致DILI类别中的药物。FDA对每种检测所分析的治疗类别进行了检查,发现这六种检测对上述五类药物的覆盖并不均衡。
总之,不同体外NAMs的药物数据集重叠量小、缺乏药物对评估以及易致DILI治疗类别覆盖不足,限制了FDA得出“哪种NAMs在预测DILI方面最可靠、最有效,从而可作为药物研发中动物测试的稳健替代方案”的明确结论。DILI评估用NAMs的开发还需要更全面、系统的数据积累、覆盖。
DILIference:一份推动DILI NAMs发展的基准清单
对文献数据的分析表明,尽管NAMs在DILI评估中展现出潜力,但在确定可作为动物模型替代品、用于预测人类DILI的可靠方法方面,仍存在重大挑战。一个关键局限性在于缺乏标准化的参考药物清单,而这对于确保评估的无偏性至关重要。Baudy等人提出了一份包含20种化合物的清单,作为肝脏微生理系统(MPS)的基准;而Segavia-Zafra等人则推荐了20种对照化合物(10种DILI阳性、10种DILI阴性)用于临床前DILI评估。通过FDA的分析,FDA推荐了一份规模更大的清单作为NAMs的基准,将其命名为“DILIference”。
详见:www.drugdiscoverytoday.com
DILIference清单的特点包括:1)包含大量药物,以确保统计相关性;2)覆盖了DILI问题较为突出的主要治疗领域;3)包含化学结构相似但DILI特征不同的药物对,以评估NAMs的分辨能力。DILIference不仅能评估不同NAMs之间的整体差异,还能评估它们对细微但关键变化的敏感性,最终提升其在预测人类DILI结果方面的实用性。
具体而言,DILIference包含107种独特药物,其中包括89种单一药物和14种药物对,这些药物均从17篇文献中筛选而来。这些药物的DILI分类是基于对美国FDA标签文件的详细分析确定的。
最后
NAMs因其在减少动物使用方面的潜力而受到广泛推崇,并可能对未来的监管应用产生重大影响。鉴于已研究和发表的NAMs数量众多且仍在不断增加,明确其在实际应用中的可靠性,尤其是确定哪些模型最适合监管用途,已成为迫切需求。FDA通过回顾性分析发现:1)在预测人类DILI方面,并非所有NAMs的表现都与动物模型相当,这凸显了将临床前策略与药物开发流程目标相结合的重要性。多参数NAMs可能比单参数方法更能模拟动物模型,这表明通过细胞绘画等多参数方法,或结合具有机制特异性的NAMs来捕捉DILI机制的复杂性,可能会更好地解决DILI评估问题;2)与MPS的比较,因共有药物数量有限,难以对它们的相对性能得出结论。未来应通过测试足够数量的共有药物,针对具体应用场景开展进一步研究;3)体外NAMs之间的两两比较,因所测试药物的重叠度存在显著差异(通常少于50种药物),影响了结果的统计稳健性。这种差异凸显了对标准化药物清单(如DILIference)的迫切需求,以便促进NAMs之间的交叉评估,并确保比较结果的一致性和可靠性。
DILIference有潜力解决本研究中提出的关键问题,并推动NAMs融入药物开发过程中的DILI评估,这与3R原则(替代、减少、优化动物实验)相符。该药物清单涵盖了5个DILI高发治疗类别、化学结构相似但DILI特征不同的药物对,以及已知存在性别差异的药物,可作为DILI评估中方法探索和验证的参考标准,从而为NAMs的研发提供支持。
引自: New approach methodologies (NAMs) for drug-induced liver injury (DILI): Where are we now?
药理毒理开发1-7群已满,想进8群的加微信,备注姓名+企业名称+专长领域。比如王**+A企业+注册或毒理。名额有限,已经在1-7群的朋友就不要跨群了。
另外,新建了GLP毒理专题负责人交流群,只有同时满足GLP机构+专题负责人两个条件的,方可入群。目前不到300人,还有名额。
热门跟贴