摘要
网络药理学 (NP) 为从整体角度理解传统医学提供了一种新的方法论视角,催生了中医网络药理学 (TCM-NP) 等前沿领域。随着人工智能 (AI) 技术的发展,NP 开发基于网络的 AI 方法,从海量组学数据中揭示复杂疾病的治疗机制是关键。本文以 TCM-NP 为重点,将涉及的 AI 方法归纳为网络关系挖掘、网络目标定位和网络目标导航三类,并介绍了 TCM-NP 在揭示冷/热证的生物学基础和临床价值方面的典型应用。总的来说,我们的综述从人工智能的角度为研究人员提供了 NP 的方法学进展及其在中医中的应用的创新概述。
关键词:网络药理学, 中医, 网络目标, 人工智能, 深度学习
TCM-NP 的起源和发展
中医 (TCM) 体现了中华民族数千年来临床实践经验和理论在疾病预防和治疗中的融合。中医将人体视为一个复杂的系统,其特点是整体视角和基于辨证的治疗 [1]。中医面临的主要挑战在于如何揭示人体复杂系统的生物学基础,如何进一步阐明各种中医术语,包括证候和草药/方剂,以及它们之间的关系,以及如何根据中医原理得出新的发现以促进精准医学。与中医的整体观相一致,随着生物信息学、系统生物学和计算生物学等交叉学科的兴起,现代医学的研究范式逐渐从“还原论”转向“整体论”,疾病诊疗的研究策略也从“单病、单靶点、单药”转向“多靶点、系统调控”, 强调从系统生物学的角度分析复杂疾病机制的重要性 [2, 3]。在此背景下,TCM-NP 作为传统医学和现代医学、信息科学和系统科学之间交叉创新的结晶而出现 [4, 5]。早在 1999 年就提出了与 TCM-NP 相关的假说和想法 [6],并在 2002 年进一步发展 [7],早于 2007 年提出的“网络药理学”概念 [8]。中医NP的特点与中医的整体性和以辨证为主的治疗原则高度吻合,已成为传统医学研究领域的前沿和热点[4,5,9]。
人工智能 (AI) 和多组学测序技术的出现和发展为 TCM-NP 在推动中医精准发展方面提供了新的结合点和支持。从方法论的角度来看,NP 的关键问题是将专注于对象特征的机器学习 (ML) 范式转变为学习特征间关系的范式,这可以增加对象的特征空间以实现特征增强 [10]。在这方面,人工智能方法,尤其是基于深度学习的方法,在从生物医学数据中自动学习特征表示方面取得了长足的进步,因此在 TCM-NP 领域发挥着越来越重要的作用 [11]。根据 Web of Science (WOS) 的统计,随着人工智能技术的快速发展,中医 NP 相关研究的数量稳步快速增长,自 2017 年以来翻了一番。特别是随着第一部专著 [5] 和标准 [4] 的发布,TCM-NP 在人工智能和大数据时代迎来了新的发展机遇 [12]。
在这篇综述中,我们将 TCM-NP 涉及的 AI 方法总结为三类:网络关系挖掘、网络目标定位和网络目标导航,其中介绍了代表性的方法案例和最先进的 (SOTA)AI 方法。我们还介绍了中医防寒证(又名中医正医)的典型应用,这是中医的两个基本概念,用于剖析证候、疾病和中医方剂之间的网络关系及其临床价值。
TCM-NP 的方法 网络目标概念和理论
精准中医的主要目标是揭示中医方剂/药物对疾病/证候的作用机制 (MoA),可以简单地看作是剖析疾病/证候与药物/方剂之间的关系 [12]。从 TCM-NP 的角度来看,该目标涉及系统地理解宏观层面的对象(包括疾病/证候、中西医)与微观层面的对象(包括细胞、基因和蛋白质)之间的多层次关系,并确定可以系统耦合这些宏观和微观层面对象的网络元素。这与 NP [8] 和网络医学 [13] 的重点一致。在这方面,邵丽提出的“网络目标”概念和理论被认为是从整体角度理解中医 MoA 的最早和最具代表性的理论之一。该理论描述了中医 NP 研究的主要任务:构建与疾病或证候相关的生物网络;进一步推断基于生物网络的中医方剂或干预疾病或证候的成分的关键模块,如图 1.
图 1TCM-NP 的网络目标概念和关键方法框架。网络目标强调中药/化合物与中医证候/疾病之间的关系反映在中草药/化合物对疾病相关分子网络模块的调控作用上。从方法论的角度来看,基于人工智能的潜在网络目标识别可以分为“网络关系挖掘”、“网络目标定位”和“网络目标导航”。
从方法论的角度来看,基于人工智能识别表征疾病/证候和药物/配方之间关系的潜在“网络目标”可分为三类:(i) 基于人工智能从先验知识或组学数据中挖掘宏和/或微观层面对象之间的关系,这可以称为“网络关系挖掘”,并被视为 TCM-NP 方法的基础。此问题可能会找到自然语言处理 (NLP) 任务和网络嵌入任务的回声;(ii) 基于 AI 的新网络关系推理,可以称为“网络目标定位”。该组织主要包括 “疾病/综合征 - 基因 ”关系预测和 “草药/天然产物 - 靶标 ”关系预测。(iii) 基于推断的网络关系,对连接中药/方剂与疾病/证候的网络模块(即网络目标)进行基于人工智能的识别,这被称为“网络目标导航”。网络导航方法的示例包括用于综合征区分的病-病关系分析、用于药物再利用/发现和配方推荐的病-药关系分析,以及用于药物协同效应和配方 MoA 的药物-药物关系分析。值得注意的是,上述方法已被整合到UNIQ系统(Using Network target for Intelligent and Quantitative analysis on drug action,UNIQ),我们小组建立了基于人工智能的研发平台,用于开发各种新药[14,15,16,17]。 在以下三个部分中,我们将概述 TCM-NP 中涉及的基于 AI 的方法的进展,其中我们还强调了基于 SOTA AI 的方法的作用,包括图神经网络 (GNN) 和网络嵌入,总结为表 1(见文末).
网络关系挖掘
从先验知识中挖掘网络关系
随着生物医学知识的积累,基于人工智能的从先验知识中挖掘药物/方剂与疾病/证候之间的关系是中医-NP 的前提和基础,并已成为当前备受关注的研究课题。从网络角度来看,网络关系主要涉及疾病/证候水平、生物分子水平和药物/方剂水平(图 2).在药物/配方层面,NLP 技术主要用于从先验知识中挖掘与疾病/证候相关的不同临床症状之间的关系。根据中医临床诊疗理论,我们不仅可以通过挖掘临床表型条目来推断临床症状的相似性 [18],还可以推断证候与表型之间的关系 [19–23]。在药物/方剂层面,方剂所含成分之间的结构相似关系主要来自PubChem [24]、ChEMBL [25]、CDCDB [26]和DrugCombDB [27]等数据库,以及方剂所含的草药与其性质的关系(如寒/热药之间的关系),这些关系来自ETCM [28]等中医相关数据库。HERB [29] 和 TCMBank [30]。在分子水平上,蛋白质-蛋白质相互作用 (PPI)、分子之间的信号和转录调控等关系主要从 STRING [31]、KEGG [32] 和 BioGRID [33] 等数据库中挖掘。中医理论强调“以辨证为基础的治疗”,根据患者不同的证候和表型特征提供治疗方案,因此证候/表型与中医/方剂的疗效也存在关系,例如从 SymMap 等数据库中挖掘的证候与中医/方剂之间的关系[34] 或基于文献中的共现原则 [35].同时,宏观和微观层面对象之间的关系也值得我们关注。因此,网络关系还包括化合物或天然产物与其相关分子靶标之间的关系,这些关系是从 HIT [36]、TCMGeneDIT [37]、DrugCentral [38] 和 DrugBank [39] 等数据库中挖掘的。这些从文献或公共数据库中挖掘的网络关系为从系统的角度理解中医提供了生物学基础,并为使用 AI 方法进行深入的方法分析奠定了数据基础。
图 2网络关系挖掘框架。表型、细胞、分子和药物之间的网络关系可以从先验知识、文献和组学数据中挖掘出来,方法分为单层和多层网络构建。
从组学数据中挖掘网络关系考虑到组学数据中嵌入的丰富特征,可以推断出不同的关系,尤其是微观水平元素之间的关系,包括细胞、基因和蛋白质。近年来,积累了大量与中药相关的组学数据,包括与特定草药和/或中医证候相关的大量转录组学[40,41]、代谢组学[42,43]以及单细胞组学[44–46]。 图 2).从数据角度来看,中医和西医与从组学数据中挖掘网络关系相关的计算方法相似。因此,基于 AI 的组学数据网络关系挖掘也可以广泛应用于 TCM-NP 领域。
以转录组学为例,挖掘潜在关系的常用方法是使用规范的 ML 算法构建共表达网络,例如统计分析 [47] 或回归 [48]。例如,Li等[40]应用了基于ML的策略,将基因共表达模式与网络拓扑特征相结合,构建了冷热综合征的分子网络,从中确定了一系列与综合征相关的生物标志物。此外,考虑到转录组学数据中的噪声,一些研究利用贝叶斯模型将组学数据与先验知识相结合,以推断更可靠的网络关系[49,50]。 例如,Li 等人将文献和微阵列基因表达数据相结合,以改进基因网络 [49]。Greene等人提出了一个数据驱动的贝叶斯推理框架,该框架整合了层次感知知识和数据纲要,以构建多样化的人体组织特异性网络,以理解多细胞功能和疾病[50]。除了基因共表达关系外,一些研究还通过整合先前知识中的基因调控或信号转导关系,从转录组数据中推断出潜在的因果关系,从而为识别上游调控因子提供计算推断[51]。
随着单细胞测序技术的发展,积累了大量与中医相关的单细胞转录组学数据[44–46],为网络关系挖掘提供了前所未有的数据资源。例如,Zhang等[44]从胃癌前病变和早期恶性Hot syndrome患者中构建了单细胞转录组学图谱。鉴于基于液滴的单细胞测序技术能够同时生成数千个细胞的转录组图谱,它为基于深度学习的细胞水平网络分析[52\u201256]和推断细胞特异性基因调控网络(GRN)提供了前所未有的机会[57]。例如,Wang 等人介绍了一种单细胞图神经网络 (scGNN),该网络使用 GNN 来建立和聚合细胞间关系,从而有效地表示基因表达和细胞间关系 [52]。尽管目前基于人工智能的研究中医相关组学数据中探索网络关系的研究还不够,但这些基于组学的网络挖掘方法将极大地扩展我们在系统层面上对中医生物学的理解,并为中医-NP方法的发展奠定坚实的基础。
网络关系分析和表示
多层网络关系的分析和表示在网络关系挖掘中也很重要。在这方面,基于 AI 的方法仍然发挥着越来越重要的作用。在疾病/综合征相关网络关系分析方面,通过基于网络拓扑的方法[58–60]评价属于同一综合征或同一疾病的不同综合征的不同表型组成的网络模块的相似性[58–60],即表型水平与疾病/综合征水平之间的关系。例如,周等[60]构建了一个临床表型网络(CPN)来研究综合征的混杂边界和症状的共存。在草药/配方相关的网络关系分析方面,可以通过整合草药靶点之间的关系来评估由属于同一配方的不同草药组成的网络模块的相似性 [61]。还可以评估由公式组成的网络模块与临床干预综合征之间的相似性 [62, 63]。Ruan等[63]提出了一种名为AMNE的新型深度自动编码器模型,用于自动检测中医方剂中症状的特定草药。此外,对疾病/证候和草药/配方的网络分析表明,多级网络节点具有模块化特性,不同级别的网络模块之间存在相似的关系。该规则是“网络目标”理论的重要含义,是 TCM-NP 方法发展的基础。
随着网络节点的大小和异构性的增加,网络的表征和低维表示是网络关系挖掘的关键方面。网络表示的核心是将网络节点进行矢量化或低维表示,从而从系统的角度分析不同网络节点的潜在关系。在这方面,node2vec等网络嵌入方法已成为网络表示的主要工具[63–71]。例如,Tian等[67]通过低维表示和特征融合实现了药物-靶点相互作用的准确预测。此外,Hou 等 [65] 整合了疾病/综合征表型、组织、细胞类型和分子相互作用数据,建立了基于图嵌入算法的人类多级异质生物网络,在多个任务中实现了高性能。
网络目标定位
基于 AI 的网络目标定位的核心是解决以下两个重要问题:(i) 如何预测与表型/综合征相关的基因;(ii) 如何预测与草药/配方相关的靶标,如图 3.
图 3网络目标分析框架。网络目标定位和导航分析主要涉及使用基于经典 ML 的方法和基于深度学习的方法来剖析涉及表型、细胞、分子和药物的多层生物网络。
疾病/综合征相关基因预测
该综合征可视为个性化的临床表型特征。个体化临床表型相关基因预测是实现个体化诊疗的重要途径。基于生物网络的表型/综合征相关基因预测算法的核心思想是利用“多级模关系”定律,根据网络拓扑特征进行预测。在这方面,传统的 ML 方法,如回归 [14] 和随机游走 (RW) [72, 73] 首次应用于表型/综合征-基因预测。例如,Wu et al. 提出的 CPHER 算法 [14] 被认为是最具代表性的算法之一 [74],它为与宏和微观生物网络相关的 AI 算法的研究提供了范式。CIPHER 算法已成功应用于复杂疾病的机制分析 [40, 75, 76]。受 CIPHER 算法的启发,提出了一系列针对综合征相关表型或临床相关症状的基于网络的基因预测算法。例如,PTsGene [77] 将中医临床表型与实验结果相结合,建立了中医症状-基因数据集,实现了对疾病-证候基因的高精度预测。近年来,随着 GNN 学习算法的提出,它逐渐成为一个热门话题,并将表型-分子网络视为用于学习和推理的复杂图结构,并取得了优异的性能。例如,CIPHER-SC [78] 融合了单细胞信息,构建了多层次生物网络,实现了基于图卷积神经网络的疾病基因预测。总的来说,这些研究表明,基于 AI 的网络分析模型可以解决中医证候的基因预测问题,为理解复杂中医术语的生物学基础铺平了道路。
中药化合物的靶点预测与疾病/证候的基因预测类似,它也是通过准确预测中药/方剂及其化合物的相关靶点来揭示中药理学的前提。从方法论的角度来看,化合物相关靶点的预测可以分为基于网络拓扑分析(如回归)的传统ML预测方法[15,81]和基于深度学习模型的预测方法[64,69,82,89]。其中,Zhao et al. 提出的药物靶点预测算法 DrugCIPHER [15] 是一种具有代表性的算法,它应用基于网络的回归分析来实现对化合物相关靶点的高精度预测。此外,基因组学数据也被整合到基于网络的分析中,以实现高精度预测[80] [81]。与传统的ML方法相比,深度学习模型可以整合大量的异构信息,如药物相似性结构、疾病治疗信息和药物活性,以执行更复杂的药物靶点预测任务,同时提高预测准确性[64,69,82,85–89]。
网络目标导航
中医具有“多成分、多靶点、系统调控”的显著特点。破译中医生物学基础的另一个关键挑战是如何从生物网络的角度理解各种中医术语之间的关系,即网络目标导航,包括病证关系、草药/方剂-病关系、方剂的相容规则及其成分的协同规则。在这方面,它是网络模块化分析的重要方法,其中传统的 ML 和深度学习模型发挥着重要作用 (图 3).
疾病-综合征关系导航
表型和综合征都是对复杂人体的临床描述。从宏角度来看,通过分析疾病相关表型与证候相关临床特征之间的网络拓扑相似性,可以揭示疾病与证候之间的关系[60,90]。 对此,周等[60]建立了CPN,为中医的个体化诊断和治疗提供了依据。从微观角度来看,我们可以通过基于疾病表型和证候特征进行相关基因预测或组学数据分析,然后基于生物分子网络构建相似性指标和相关性分析来实现疾病诊断和证候鉴别的整合 [40, 42, 65, 91–93, 94].例如,挖掘冷/热证与神经-内分泌-免疫(NEI)生物网络之间的关系[91],分析脾虚证的生物学基础及其与消化系统疾病的关系[92],分析冠心病(CHD)中PBS综合征的生物学基础,并建立诊断标志物以实现“同病不同治疗”[42]。
草药/方剂-疾病关系导航
在 TCM-NP 中导航草药/方剂-疾病关系主要是指在特定疾病或证候的背景下对草药/方剂进行基于网络的精确推荐。通常,基于人工智能的配方推荐方法根据先前知识的宏层面信息推断草药/配方模块与特定症状/综合征之间的关系[95–98]。随着多组学和微观网络分析的积累,通过整合草药/方剂-靶点网络和疾病/证候-基因网络,提出了更准确的推荐方法。例如,周 et al. 提出了一种融合多层次信息的智能公式推荐系统 FordNet [99],可以认为是融合宏微观信息的代表作品之一。此外,通过基于草药/方剂-靶点网络和疾病/证候-基因网络的模块间关联分析,也可以发现中医方剂的新适应症[100–103]。例如,Chen等[100]利用一种基于NP的方法研究了可以与多个靶点良好对接的中药候选药物,并成功找到了治疗阿尔茨海默病的最佳中药配方。
中医方剂相关 MoA 导航
中医方剂相关 MoA 导航的一般研究框架包括:中医方剂活性成分的鉴定;中医方剂干预的疾病/证候基础网络的构建;基于疾病/证候相关网络的中医方剂活性成分网络靶点的发现。迄今为止,该框架已广泛应用于许多公式的MoA分析[104–107]。此外,研究草药/方剂的相容规律也是 TCM-NP 的一个重要问题。研究方剂相容性规律的本质也是探索成分-靶点关系的模定律,通过识别草药-草药关系来进一步建立分子式的关联规则[108–112]。Li等[109]建立了一个基于距离的互信息模型(DMIM)来测量草药之间的相互作用,并构建了一个草药网络,从而在许多公式中确定了草药之间的有用关系。此外,Yang等[112]从480种中草药中发现了一种可重复使用的COVID-19药物组合。综上所述,分析草药/配方模块之间的草药-草药关系是通过挖掘草药/配方中多个成分的 MoA 以及应用 AI 方法挖掘配方的相容性规则来实现的。
TCM-NP在冷/热证中的代表性应用
寒/热证是中医的基本概念,在个性化临床实践中得到了广泛的应用。在本节中,我们将介绍 TCM-NP 在冷/热证中的代表性应用,其中我们将强调冷/热证的生物学基础及其在疾病精准诊断和治疗中的潜力,如下所示图 4.
图 4中药NP在寒/热证和草药中的构建、分析和应用。通过收集和剖析冷/热证相关多组学数据,首次构建了冷/热证相关分子网络,以促进胃病的精准诊断和治疗 [113, 115, 116]。
冷/热证的特点是患者的一系列临床特征。揭示与证候相关的生物学基础涉及理解与宏观临床特征相关的微观生物分子。早在 2007 年,Li 等人就率先利用文献挖掘和网络拓扑分析方法构建了 NEI 系统背景下冷/热证的分子网络 [91]。结果显示,Cold 综合征相关子网络主要以激素相关因素为特征,而 Hot 综合征相关子网络以免疫相关因素为主,这两个网络通过神经递质连接。本研究开创了使用 TCM-NP 方法揭示中医证候的生物学基础的先例。随后,通过整合网络目标定位算法 CIPHER [14] 和冷/热综合征相关转录组学数据,Li 等人揭示了冷/热综合征涉及代谢-免疫调节背后的网络失衡,并确定了与综合征相关的生物标志物,包括与冷综合征相关的生物标志物,如 LEP 和 NOS1,以及与热综合征相关的生物标志物,如 CCL2 [40].因此,这些发现表明,冷/热证的生物学基础问题可以用 TCM-NP 方法来解决。
然后,利用网络目标导航分析来理解 Cold/Hot 证相关基因与疾病发生发展的关系,从而指导个体化疾病的诊断和治疗。具体来说,基于网络拓扑的网络目标导航分析可用于分析冷/热证相关基因与疾病相关分子之间的网络关系,从中可以识别网络模块并进一步分析其临床价值 [113]。然后,建立了深度学习模型,表明与冷/热证相关的舌涂层图像特征对早期胃癌风险具有预测价值 [114]。此外,冷/热综合征相关网络节点可能显示与肿瘤发展和进展的关联。例如,通过将基于网络的预测与组学数据相结合,已经建立了胰腺癌预后相关的生物网络,其中发现了参与热相关 TGFβ 信号通路的几个节点 [75]。因此,这些研究通过将基于 TCM-NP 的计算分析与生物学和临床实验相结合,强调了理解冷/热证在促进疾病精准诊断和治疗方面的重要作用。
揭示寒/热证的生物网络基础的另一个重要问题是指导中医方剂的精确使用。根据辨证治医原则,不同人群使用中医方剂应根据患者个体证候和临床特点。因此,通过网络目标导航分析,即分析冷/热证相关的分子网络与冷/热草药的目标网络之间的拓扑关系,我们可以揭示不同冷/热草药的 MoA 并指导其精确使用。正如预期的那样,通过网络拓扑分析,我们发现 Cold 综合征相关草药倾向于在 Hot 综合征相关网络模块中富集,而 Hot 综合征相关草药倾向于在 Cold 综合征相关网络模块中富集 [91]。这种分布模式与中医“暖寒凉热”的原则是一致的。此外,将网络分析与实验验证相结合,还可以揭示方剂的药理机制,指导患者的个体化治疗。例如,基于胃炎冷/热证相关生物网络,我们发现了治疗胃炎的两个代表性中医方剂——味复春(WFC)和莫罗丹(MLD)的不同MoA,其中WFC [115]侧重于调节炎症途径,而MLD [116]侧重于抑制脂肪酸代谢,有助于临床上胃炎的精准治疗。
结束语和未来展望
中医强调以辨证和方剂使用为基础的治疗,具有整体调节的特点。中医新学科作为一门新兴的交叉学科,在中医研究中被广泛接受,并被广泛用于世界各地各种传统医学的研究。在 AI 算法和多组学时代,TCM-NP 迎来了新的发展机遇,有望带来一些突破。
重要的是,我们将为人工智能和多组学技术时代 TCM-NP 方法的发展提出几个深刻而有见地的观点,包括:(i) 与人工智能技术的基于网络的集成;(ii) 深度网络关系挖掘;(iii) 网络目标定量定位和导航;(iv) 开发深度可解释的网络药理学模型。
首先,多模态数据与 AI 技术的融合是 NP 方法论中的一个重要研究方向和热点。综上所述,基于AI的网络整合分析主要包括以下三个方面:多组学数据整合、组学数据与先验知识整合和多源异构生物网络整合。对于第一个方面,主要涉及使用生物网络以数学方式表示组学数据中的多层次信息,例如细胞-细胞、细胞-分子和分子-分子关系。例如,Sun等[117]开发的Scissor算法可以通过在相关矩阵上提出一个网络正则化稀疏回归模型来推断“表型-细胞”关系,该模型集成了与表型相关的大量和单细胞表达数据。未来,随着多组学数据的积累,我们可以期待 TCM 相关整合算法的出现。至于第二个方面,将先验知识与组学数据进行基于网络的集成,以减少噪声和组学数据有限样本的影响,这一点至关重要。在这方面,贝叶斯网络是常用的 AI 模型,它通常将知识衍生的关系视为先验分布,而那些组学衍生的关系视为后验分布。例如,Greene等[50]利用贝叶斯模型构建了一个组织特异性网络,整合了来自基因本体数据库的组织水平关系和来自转录组数据的组织水平关系。近年来,包括迁移学习在内的几种深度学习模型被用来整合先验知识和组学数据之间的关系,例如 Geneformer [11]。至于第三个方面,虽然不同的生物网络可能代表异构信息,但它们可以在数学上建模为邻接矩阵,因此可以集成到统一的人工智能算法下,这为从 NP 角度集成异构生物网络提供了可能性。
其次,分子通常以组织特异性甚至细胞类型特异性的方式表达,这证明了组织/细胞特异性网络的构建在阐明综合征/疾病机制以及草药/配方的 MoA 中的关键作用。因此,需要新的人工智能方法来系统地挖掘表型和分子之间的组织水平和/或细胞水平的关系[118,119]。例如,Chen等[118]提出了一个迁移学习框架来预测单细胞水平的癌症药物反应。scDEAL 可以使用在收集的大量和单细胞 RNA-seq 数据上预先训练的迁移学习模型来推断细胞特异性网络并解释与耐药性相关的特征。我们希望使用 AI 方法深入挖掘细胞与细胞类型特异性分子与疾病/证候或配方/草药干预相关的单细胞多组学数据之间的关系,将成为理解 NP 中医 MoA 的新视角。
第三,我们敏锐地意识到网络目标模式转向定量研究的必然性。因此,TCM-NP 必须设计定量指标来衡量网络目标效应,包括干预剂量和药物反应,然后提出 AI 模型来从已建立的网络中定量预测网络目标。在这方面,早在 2015 年就提出的药物组合对疾病/综合征生物网络的定量干预模型 [120] 可能会为新的定量 AI 模型的开发付出代价。
最后,传统的 AI 模型通常会受到 “大规模、多样化模态 ”网络数据和模型可解释性的阻碍。因此,我们强调开发深度可解释网络关系推理框架的重要性,该框架旨在通过整合宏观和微观层面的信息来揭示来自多组学和多模态生物数据的特征之间的网络关系,并确定关键的网络模块 [10]。深度可解释网络关系推理框架提供了两个主要优点:(i) 模型中的网络层次结构和节点具有明确的生物学意义,允许可解释的特征学习,以及 (ii) 该模型不仅学习网络的特征,还学习它们的关联,从而扩展了特征空间,促进了生物网络中基于 AI 的方法的低泛化和可解释性不足的问题。此外,大型语言模型 (LLM) 等语言模型 (LM) 技术的快速发展克服了计算资源和数据量的限制,这可能有助于开发深度可解释的网络关系推理模型并促进 NP 方法的发展。
Table 1
Representative AI algorithms/data resources involved in TCM-NP
TCM-NP methodologies Categories AI algorithms/data resources Brief description Publish year Ref. Network relationship mining Prior knowledge-derived KEGG Relationships among genes and genomes 1999 [32] STRING Relationships among proteins 2003 [31] TCMGeneDIT Relationships among herbs, genes and diseases 2008 [37] DrugBank Relationships between drugs and targets 2008 [39] PubChem Relationships among small molecules 2009 [24] HIT Relationships between herbal active ingredients and targets 2010 [36] DrugCentral Relationships between drugs and targets 2016 [38] ChEMBL Relationships among bioactive molecules with drug-like properties 2019 [25] ETCM Relationships among herbs contained in formulas and their properties 2019 [28] SymMap Relationships among TCM-related symptoms 2019 [34] DrugCombDB Relationships among drugs 2020 [27] HERB Relationships among herbs contained in formulas and their properties 2021 [29] BioGRID Relationships among proteins 2021 [33] CDCDB Relationships among drugs 2022 [26] TCMBank Relationships among herbs contained in formulas and their properties 2023 [30] Omics data-derived LMMA Refined gene network combined literature and micro-array gene-expression data 2006 [49] Regression Biological network of Hot syndrome and Cold syndrome 2013 [40] Bayesian inference Multicellular function and disease with human tissue-specific networks 2015 [50] Single-cell Transcriptomics Single-cell transcriptome network underlying gastric premalignant lesions and early gastric cancer 2019 [44] Nonlinear ordinary differential equations/ regulatory factors Gene regulatory or signal transduction relationships 2020 [51] scGNN GNNs for representation of gene expression and cell–cell relationships 2021 [52] Network relationship analysis and representation Literature co-occurrence Co-occurrence network between syndromes-level and symptoms-level. 2014 [60] AMNE Deep auto-encoder model for formula-symptom network construction 2019 [63] MHADTI Heterogeneous information network embedding for drug–target interactions prediction 2022 [67] GLIM Graph embedding algorithm for heterogeneous biological network construction 2022 [65] Network target positioning Disease/syndrome-related gene prediction CPHER Logistic regression-based method for disease-gene prediction 2008 [14] PTsGene Network topology-based method for diseases/syndromes-genes prediction 2020 [77] CIPHER-SC Graph convolution network for disease-gene prediction 2020 [78] Target prediction of compound in TCM DrugCIPHER Regression based method for compound-related targets prediction 2010 [15] idTRAX ML method for effective anti-cancer drug targets 2019 [80] HGNA-HTI Heterogeneous GNN for herb-target interactions prediction 2021 [82] DrugBAN Bilinear attention network for drug–target prediction 2023 [87] Network target navigating Disease–syndrome relationships navigating Literature co-occurrence Relationships between syndrome-level and symptom-level. 2014 [60] CIPHER Relationships between spleen qi deficiency syndrome and digestive diseases 2020 [92] RNA-seq, DIA-based proteomics, and untargeted metabolomics Biological basis of PBS syndrome in CHD 2022 [42] Herbs/formulas–disease relationship navigating SVM, MLR, RF and Fully Connected Neural Network ML and deep learning methods for optimum formulas for Alzheimer’s disease 2019 [100] FordNet Convolution neural network for formula recommendation with phenotype and molecule information 2021 [99] KDHR Graph convolution network for herb recommendation with symptom and herb features representation 2022 [95] TCM formula-related MoA navigating DMIM Network topology method for identifying useful relationships between herbs in formulas 2010 [109] Random walk with restart (RWR) Efficacy of Si Ni San (SNS) intervention in NAFLD 2021 [104] Graph embedding and graph convolutional network Reusable drug combination for COVID-19 from 480 Chinese herbal medicines. 2022 [112]
中医药基础科研服务:
相关咨询,加微信:1278317307。
【福利时刻】科研服务(点击查看):、、、、、。咨询加微信:1278317307。
中药及单体521
中药及单体 · 目录
上一篇农林1区: 长春中医大揭示葛根素激活自噬诱导巨噬细胞M2极化发挥抗酒精性脂肪性肝炎活性
热门跟贴