一文搞懂网络药理学：从理论到实操！|中药|生物学|网络药理学|药代|靶点

其实很早就想整理网络药理学的内容了，主要是很多果友咨询，但确实时间上抽不开身。在生信分析时，通过差异基因来选表型、定基因是常规策略；网络药理学、WGCNA或者聚类分析构建预后模型也是常用生信分析方法。关于WGCNA和聚类分析构建预后模型，我们曾经做过整理，这次我们重点来分享网络药理学。

从本质或定义上来说，网络药理学（Network Pharmacology）是一种基于系统生物学和计算生物学的方法，旨在理解药物在复杂生物系统中的作用机制。与传统药理学通常关注单一靶点不同，网络药理学将药物、靶点、疾病和生物网络中的其他元素视为一个整体。其核心思想是“多靶点、多通路”协同作用，从而研究它们之间的互作以及相互依赖关系。

数据层面上网络药理学需要整合化合物靶点（如TCMSP、STITCH）、疾病相关基因（DisGeNET、OMIM）、通路（KEGG）等数据库；分析方法上则综合网络分析（如PPI互作、模块挖掘）和拓扑特征（度中心性、介数中心性）预测关键靶点。同时还可以结合分子对接（Autodock）或体外、体内实验，验证核心靶点或通路。非常适合研究复杂药物系统（如中药），避免单一靶点的局限性。

网址：https://www.tcmsp-e.com/tcmsp.php

第一步、中药成分筛选。网络药理学第一步，是我们要清楚研究对象的主要成分。这里需用到 TCMSP（The traditional Chinese medicine systems pharmacology database and analysis platform）数据库，中文全程为中药系统药理学数据库与分析平台。比如我们研究枸杞对脑卒中是否有作用，作用靶点是什么。为了确认枸杞对生物体真正起功效的成分，我们依据OB值和DL值进行筛选。OB值(oral bioavailability)，即生物利用度，指的是制剂中药被吸收入人体循环的速度与程度（参考值为30%）；DL值(drug-like properties)，即类药性，指的是化合物与已知药物的相似性。具有类药性的化合物并不是药物，但是具有成为药物的可能（参考值为0.18）。筛选中，OB值和DL值越大越好！

网址：https://pubchem.ncbi.nlm.nih.gov

第二步、结构信息获取。PubChem，是一个生环化材中应用分子的数据模型库，由NCBI维护，可以查询药物成分的 SMILES ID。输入主要成分的名称，我们可以获得某个成分的SMILES ID（化学结构的线性表示法）。

我们以枸杞主要成分之一Sitosterol alpha1为例演示，SMILES ID: C/C=C(/CC[CH]2[CH]4[CH]([C@H]4C)O)C)C)\C(C)C。

网址：https://www.novopro.cn/tools/mol2smiles.html

或者在TCMSP下载药物成分的3D结构式，再通过3D结构在线转换获得SMILES ID。得到的SMILES ID: CC=C(CC[CH](O)CC[C@]4(C)[C@H]3CC[C@@]21C)C(C)C。

步骤三、化合物再筛选。第一步是通过OB值和DL值对药物成分进行过滤，这一步则是在药代动力学层面探究药物成分的有效性。这里用到SwissAMDE数据库，用于药代动力学属性分析，并预测一个或多个小分子的ADME参数、药代动力学性质、类药性。只需要将第二步获得的SMILES ID粘贴到对话框即可，结果如下。

筛选依据主要看两个参数：①胃肠道吸收效率（GI absorptoon为high）；②类药性（Druglikeness里的参数至少有两个YES）。如果不满足上述条件，就把该成分剔除掉，不再用于后续分析，再尝试其他成分。显然，枸杞中Sitosterol alpha1不符合上述条件。真正在课题中，我们需要继续筛选其他有效成分。

第四步、靶点预测。得到有效药物成分以后，我们可以通过SwissTargetPrediction预测药物成分可能的生物学靶点。该网站主要利用化合物的2D和3D结构相似性来推断与已知药物靶点的潜在相互作用。

得到的靶基因可以CSV的形式导出。我们可以保留“Common name列”的所有基因名。Probability表示成分对应Target的可能性。为了尽可能保留多的target，我们无需删除，除非Probability = 0。在我们的示例中，排除 Probability = 0的基因，得到62个靶点。

筛选到的靶基因结果（部分）

第五步、疾病靶点获取。在得到靶基因之后，我们需要找到这些 Target是不是跟某种疾病密切相关。怎么办呢？就是要有疾病用基因特征或基因集来定义的思维。GeneCards网站可自动收录来自约150个网站的以基因为中心的数据，包括基因组、转录组、蛋白组学、遗传、临床及其功能的信息，可用于疾病相关基因的检索。

网址：https://www.genecards.org/

输入疾病名称后，可在右上角Export处直接导出疾病相关基因（最多可以下载10000行）。然后，我们根据"Relevance score"列的中位数或平均值或TOP2000等标准对疾病靶点基因进行过滤，比如只保留所有大于该中位数的Gene Symbol。

第六步、靶点整合，疾病特征基因确认。除 GeneCards外，OMIM是一个综合的、权威的研究人类表型和基因型关系的数据库，收录了超过16000个基因的疾病信息。DisGeNET也收集了遗传性疾病的信息，包括遗传突变位置、基因变异性质、蛋白表达及功能等，也可以获得相应的疾病基因集。为了保证疾病基因集的准确性，我们把从这三个网站得来的基因取交集（韦恩图）。

网址：https://molbiotools.com/listcompare.php

第七步、交集分析。为了确定药物成分与疾病的关系，需要把药物成分靶基因（步骤四）与疾病特征靶基因（步骤六）再取交集。这里的交集基因就是药物成分作用于疾病的潜在靶点。如果没有得到交集基因，则该次分析失败，可以更改疾病再进行分析。示例数据有32个交集基因。

网络药理学分析做到这一步，主要分析就完成了。接下来我们就可以通过STRING数据库和Cytoscape软件进行核心靶点筛选（第八步），并借助在线工具或者代码完成富集分析（第九步）。这些内容在纯生信21天教程里都有详细的推文和视频解读，我们不再赘述。

从整体思路来讲，网络药理学是药物→基因→疾病的综合分析，是一种特殊的生信分析。网络药理学（以及衍生的网络毒理学）文章在2023-2024年经历了过山车式的热度变化，其核心套路已被拆解。随着内卷加剧和审稿人认知升级，单纯药理学分析已很难发表。

芒果之见：2025年网络药理学可以①引入时间序列（如药物处理不同时间点的转录组），或者②结合scRNA-seq数据定位靶点细胞亚群，或者③多组学整合，代谢组+蛋白互作+表观调控；也可以结合孟德尔随机化验证靶点-疾病的因果关联，或者基于CRISPR筛选验证枢纽基因，如DepMap数据辅助选题；又或者用TCGA/TARGET数据库分析核心靶点的预后价值。这些内容也是纯生信突围的方向！因此，网络药理学的突围，也是生信分析的突围！大家一起加油，争取早日发表论文~~

参考资料，仅用于学术交流。

https://mp.weixin.qq.com/s/XpmMWJXE8qfzrU3PBoCwSA