撰文丨易
在精准医疗领域,对微创生物标志物的需求极为迫切,以期实现疾病的精准诊断、患者分层和治疗监测。血液蛋白质组学,即对血液中数千种循环蛋白质的系统性分析,为捕获疾病特异性特征提供了极具前景的途径。然而,传统的生物标志物发现研究大多采用“病例-对照”设计,仅将单一疾病与健康人群进行比较。这种方法存在显著局限性,它忽视了不同疾病表型之间的复杂性和重叠性,导致所发现的生物标志物往往缺乏足够的特异性,难以在更广泛的临床场景中稳健应用。这也是为何大量此类研究最终仅有极少数能成功转化为临床实践的原因之一。近年来,蛋白质组学检测技术的飞速发展,使得大规模、高通量地分析血浆蛋白质组成为可能。尽管已有一些研究成功展示了大规模蛋白质组学在癌症等特定疾病中的应用潜力,但针对多种疾病进行系统性比较的大规模“泛疾病”研究仍然匮乏。
近日,瑞典皇家理工学院Mathias Uhlén在Science期刊上发表题为A human pan-disease blood atlas of the circulating proteome的研究论文,通过构建一个涵盖59种疾病、8000多名个体的大规模血液蛋白质组图谱,揭示了疾病特异性和共享的蛋白质特征,为精准医学提供了重要的公共数据资源。
作者团队采用了基于邻位延伸分析技术的下一代靶向蛋白质组学方法,对来自8262名个体的9027份样本进行了分析,测量的蛋白质靶标数量高达5416种。研究设计包含了多个精心设计的队列:首先,一个“健康队列”对96名50-65岁的健康个体进行了为期两年的纵向跟踪,以确定健康状态下蛋白质组的基线稳定性和个体内变异。其次,一个“发育队列”对100名个体从4岁到24岁(4、8、16、24岁四个时间点)的血液样本进行了分析,以描绘从童年到成年过程中蛋白质组的动态变化。最为关键的是,研究收集了一个庞大的“疾病队列”,包含6074份血浆样本,覆盖了心血管、代谢、癌症、精神、自身免疫、传染性及儿科疾病等7大类共59种疾病患者以及健康对照。所有样本均使用统一的Olink Explore平台进行检测,确保了数据的高度可比性。数据分析层面,研究综合运用了多种统计和计算方法,包括混合效应模型以量化年龄、性别、个体差异等因素对蛋白质浓度的影响,方差分析以评估不同因素(如疾病状态、人口统计学特征)对蛋白质组变异的贡献度,差异丰度分析以识别疾病特异的蛋白质特征,以及机器学习模型来构建疾病分类器和预测生物学年龄、性别等特征,从而深入挖掘数据中蕴含的生物学洞见。
本研究产生的成果是多维度且层次丰富的,它不仅仅是一份蛋白质清单,更是一张动态揭示了健康与疾病状态下人体内部状态的地图。首先,在健康基线建立方面,对96名中年健康个体为期两年的追踪证实,每个人的血液蛋白质组像指纹一样具有高度独特性,且这种个体特异性远大于年龄、性别等固定效应带来的差异,在两年内表现出惊人的时间稳定性。这为定义“健康”的分子基准提供了关键数据,任何显著的偏离都可能是疾病或衰老的早期信号。同时,研究精确评估了5416种目标蛋白在血液中的可检测性,发现约38%的蛋白质能稳定地在健康个体中检测到,而约50%的蛋白质几乎从未被检测到,这为后续疾病研究区分了高信噪比的靶点。
其次,在生命历程动态变化层面,对100名个体从4岁到24岁的分析揭示了一幅蛋白质组的发育图谱。研究发现,蛋白质组在青春期经历了最剧烈的重塑。通过混合效应模型,研究清晰地分辨出哪些蛋白质变化主要受年龄驱动(如与牙齿釉质形成相关的AMBN蛋白在儿童期后急剧下降)、哪些受性别驱动(如男性生殖系统特有的INSL3蛋白在青春期仅在男性中飙升)、以及哪些保持了较高的个体特异性稳定性。这些轨迹不仅解释了生理发育的分子基础,也为识别儿童发育障碍或性腺相关疾病的异常提供了参照系。
第三,在泛疾病视角下,研究有力地证明,传统的“病例-对照”研究模式会高估许多生物标志物的特异性。例如,在胰腺癌中升高的FGF1蛋白,在细菌感染患者中同样显著升高;在自身免疫病中变化的CES3蛋白,在登革热患者中变化更为剧烈;作为肝癌候选标志物的GSTA3蛋白,实际上在多种慢性肝病中均有升高。这一发现揭示了不同疾病间共享的分子路径,警示了开发高特异性诊断工具时必须考虑跨疾病的干扰。通过方差分析,研究定量确定了影响蛋白质组变异的四大因素:疾病状态是最大的变异来源,其影响远超年龄、性别和BMI。研究还识别出一小部分在数十种疾病中均发生变化的“枢纽蛋白”,它们可能与机体的通用性应激反应或全因死亡率相关。
最后,在模型构建与转化潜力上,研究展示了蛋白质组数据强大的预测能力。利用机器学习,仅凭50种蛋白质的血浆浓度就能高精度地预测个体的“生物学年龄”,其预测值与实际年龄高度吻合,为衡量衰老速度提供了分子尺子。在癌症方面,研究不仅扩大了样本量和检测范围,验证了如卵巢癌中的PAEP等已知标志物,还发现了新的候选靶点。尤为重要的是,利用英国生物银行的前瞻性数据进行的验证表明,基于确诊癌症患者数据训练的模型,能够在一定程度上识别出在数年后才被临床诊断为肺癌的个体的早期血液样本信号,这为真正的早期无症状检测带来了希望。
综上所述,本研究通过其宏大的规模、统一的检测平台和系统性的比较分析,超越了单一疾病研究的局限,生动描绘了血液蛋白质组如何作为一个整合器,同时反映个体的发育阶段、生理特征、衰老进程和疾病状态。它既是一个供全球科研人员探索的宝贵公共资源,也为未来发现真正特异、稳健的疾病生物标志物和深入理解疾病共有的病理生理机制设立了新的标准。
https://www.science.org/doi/10.1126/science.adx2678
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴