其实很早就想整理网络药理学的内容了,主要是很多果友咨询,但确实时间上抽不开身。在生信分析时,通过差异基因来选表型、定基因是常规策略;网络药理学、WGCNA或者聚类分析构建预后模型也是常用生信分析方法。关于WGCNA和聚类分析构建预后模型,我们曾经做过整理,这次我们重点来分享网络药理学。
从本质或定义上来说,网络药理学(Network Pharmacology)是一种基于系统生物学和计算生物学的方法,旨在理解药物在复杂生物系统中的作用机制。与传统药理学通常关注单一靶点不同,网络药理学将药物、靶点、疾病和生物网络中的其他元素视为一个整体。其核心思想是“多靶点、多通路”协同作用,从而 研究它们之间的互作以及相互依赖关系。
数据层面上网络药理学需要整合化合物靶点(如TCMSP、STITCH)、疾病相关基因(DisGeNET、OMIM)、通路(KEGG)等数据库;分析方法上则综合网络分析(如PPI互作、模块挖掘)和拓扑特征(度中心性、介数中心性)预测关键靶点。同时还可以结合分子对接(Autodock)或体外、体内实验,验证核心靶点或通路。非常适合研究复杂药物系统(如中药),避免单一靶点的局限性。
网址:https://www.tcmsp-e.com/tcmsp.php
第一步、中药成分筛选。 网络药理学第一步,是我们要清楚研究对象的主要成分。这里需用到 TCMSP(The traditional Chinese medicine systems pharmacology database and analysis platform)数据库,中文全程为 中药系统药理学数据库与分析平台。比如我们研究枸杞对脑卒中是否有作用,作用靶点是什么。为了确认枸杞对生物体真正起功效的成分,我们依据OB值和DL值进行筛选。OB值(oral bioavailability),即生物利用度,指的是制剂中药被吸收入人体循环的速度与程度(参考值为30%);DL值(drug-like properties),即类药性,指的是化合物与已知药物的相似性。具有类药性的化合物并不是药物,但是具有成为药物的可能(参考值为0.18)。筛选中,OB值和DL值越大越好!
网址:https://pubchem.ncbi.nlm.nih.gov
第二步、结构信息获取。PubChem,是一个生环化材中应用分子的数据模型库,由NCBI维护,可以查询药物成分的 SMILES ID。输入主要成分的名称,我们可以获得某个成分的SMILES ID( 化学结构的线性表示法 )。
我们以枸杞主要成分之一Sitosterol alpha1为例演示,SMILES ID: C/C=C(/CC[CH]2[CH]4[CH]([C@H]4C)O)C)C)\C(C)C。
网址:https://www.novopro.cn/tools/mol2smiles.html
或者在TCMSP下载药物成分的3D结构式,再通过3D结构在线转换获得SMILES ID。得到的SMILES ID: CC=C(CC[CH](O)CC[C@]4(C)[C@H]3CC[C@@]21C)C(C)C。
步骤三、化合物再筛选。第一步是 通过OB值和DL值对药物成分进行过滤,这一步则是在药代动力学层面探究药物成分的有效性。这里用到SwissAMDE数据库,用于药代动力学属性分析,并预测一个或多个小分子的ADME参数、药代动力学性质、类药性。只需要将第二步获得的SMILES ID粘贴到对话框即可,结果如下。
筛选依据主要看两个参数:①胃肠道吸收效率(GI absorptoon为high);②类药性(Druglikeness里的参数至少有两个YES)。如果不满足上述条件,就把该成分剔除掉,不再用于后续分析,再尝试其他成分。显然,枸杞中Sitosterol alpha1不符合上述条件。真正在课题中,我们需要继续筛选其他有效成分。
第四步、靶点预测。得到有效药物成分以后,我们可以通过SwissTargetPrediction预测药物成分可能的生物学靶点。该网站主要利用化合物的2D和3D结构相似性来推断与已知药物靶点的潜在相互作用。
得到的靶基因可以CSV的形式导出。我们可以保留“Common name列”的所有基因名。Probability表示成分对应Target的可能性。为了尽可能保留多的target,我们无需删除,除非Probability = 0。在我们的示例中,排除 Probability = 0的基因,得到62个靶点。
筛选到的靶基因结果(部分)
第五步、疾病靶点获取。在得到靶基因之后, 我们需要找到这些 Target是不是跟某种疾病密切相关。怎么办呢?就是要有疾病用基因特征或基因集来定义的思维。GeneCards网站可自动收录来自约150个网站的以基因为中心的数据,包括基因组、转录组、蛋白组学、遗传、临床及其功能的信息,可用于疾病相关基因的检索。
网址:https://www.genecards.org/
输入疾病名称后,可在右上角Export处直接导出疾病相关基因(最多可以下载10000行)。然后,我们根据"Relevance score"列的中位数或平均值或TOP2000等标准对疾病靶点基因进行过滤,比如只保留所有大于该中位数的Gene Symbol。
第六步、靶点整合,疾病特征基因确认。除 GeneCards外,OMIM是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了超过16000个基因的疾病信息。DisGeNET也收集了遗传性疾病的信息,包括遗传突变位置、基因变异性质、蛋白表达及功能等,也可以获得相应的疾病基因集。为了保证疾病基因集的准确性,我们把从这三个网站得来的基因取交集(韦恩图)。
网址:https://molbiotools.com/listcompare.php
第七步、交集分析。为了确定药物成分与疾病的关系,需要把药物成分靶基因(步骤四)与疾病特征靶基因(步骤六)再取交集。这里的交集基因就是药物成分作用于疾病的潜在靶点。如果没有得到交集基因,则该次分析失败,可以更改疾病再进行分析。示例数据有32个交集基因。
网络药理学分析做到这一步,主要分析就完成了。接下来我们就可以通过STRING数据库和Cytoscape软件进行核心靶点筛选(第八步),并借助在线工具或者代码完成富集分析(第九步)。这些内容在纯生信21天教程里都有详细的推文和视频解读,我们不再赘述。
从整体思路来讲,网络药理学是药物→基因→疾病的综合分析,是一种特殊的生信分析。网络药理学(以及衍生的网络毒理学)文章在2023-2024年经历了过山车式的热度变化,其核心套路已被拆解。随着内卷加剧和审稿人认知升级,单纯药理学分析已很难发表。
芒果之见:2025年网络药理学可以①引入时间序列(如药物处理不同时间点的转录组),或者②结合scRNA-seq数据定位靶点细胞亚群,或者③多组学整合,代谢组+蛋白互作+表观调控;也可以结合孟德尔随机化验证靶点-疾病的因果关联,或者基于CRISPR筛选验证枢纽基因,如DepMap数据辅助选题;又或者用TCGA/TARGET数据库分析核心靶点的预后价值。这些内容也是纯生信突围的方向!因此,网络药理学的突围,也是生信分析的突围!大家一起加油,争取早日发表论文~~
参考资料,仅用于学术交流。
https://mp.weixin.qq.com/s/XpmMWJXE8qfzrU3PBoCwSA
热门跟贴