点评 | 宁光(中国工程院院士)、程涛(中国工程院院士)、李汉杰(中国科学院深圳先进技术研究院 )
人类免疫系统是一个高度复杂且维持动态平衡的细胞网络,其个体间差异主要由遗传背景、环境暴露及衰老过程共同驱动。阐明驱动人类免疫多样性的遗传与非遗传调控机制,对于理解免疫介导性疾病的易感性具有重要意义。通过整合单细胞组学与基因型信息,研究人员能够在特定细胞类型和生物学背景下建立遗传变异与基因调控之间的关联,从而揭示这些变异在健康、疾病以及不同人群中的功能效应。然而,该领域的发展长期受限于大规模单细胞表观组数据的缺乏,以及现有数据集中欧洲裔个体的过度代表性。
为填补上述空白, 2026 年 1 月 9 日, 华大生命科学研究院牵头建设的 基因组多维解析技术全国重点实验室联合上海交通大学医学院附属瑞金医院、山西医科大学等多家机构,在 Science 正式发布外周血免疫多组学图谱 CIMA :
Chinese Immune Multi-Omics Altas。研究团队通过对超过一千万个外周血免疫细胞进行多组学联合分析,系统解析了外周血免疫细胞的功能特征,阐明了免疫表型及相关疾病的细胞特异性调控机制。该研究为理解人群免疫多样性、解析免疫导疾病的遗传基础提供了关键性的参考框架与数据资源,将持续推动免疫相关疾病的基础研究与临床转化。
在数据构建层面,研究团队对健康成年人的外周血进行了系统性多组学分析,整合了超过 1000 万个外周血免疫细胞的单细胞 转录组 与表观组数据,以及血浆脂质组、 代谢组 的多组学数据。通过细胞聚类与免疫细胞功能基因分析,共鉴定出 73 种免疫细胞类型。基于千万 级单细胞数据,频率低于 0.1% 的稀有细胞类型亦得到有效解析。该数据集完整呈现了各细胞亚群的分布特征及其差异表达基因谱,为深入解析人体外周血免疫细胞的功能状态与调控机制提供了高分辨率图谱。结合队列生理与体检数据,研究团队进一步鉴定了多个受衰老与性别显著影响的免疫细胞亚群及相关分子。此外,所收集的详细生活习惯数据(如运动频率、吸烟史等)为探索其他因素对免疫功能的影响提供了重要支持。
在机制解析方面,基因调控网络作为染色质状态、转录因子与靶基因之间复杂互作关系的系统性表征,是理解细胞身份建立、维持及其在疾病中失调机制的关键理论框架。基于前述高质量单细胞多组学数据,研究团队构建了增强子驱动的基因调控网络,鉴定出 404 个增强子关联调控单元,涵盖 84,625 个调控区域与 13,645 个靶基因,系统解析了 61 种免疫细胞亚群中关键转录因子与顺式调控元件及靶基因之间的调控关系,形成全面的免疫细胞特异性调控图谱。此外,团队进一步构建了衰老相关免疫细胞特异性基因调控网络,并系统评估了性别对转录因子活性的影响。该基因调控网络的建立为理解免疫细胞身份的建立与维持提供了新视角,也为疾病状态下调控网络紊乱机制的研究奠定了基础。
为进一步从遗传调控维度解析免疫变异,研究团队通过对上述人群进行全基因组测序并结合单细胞多组学数据,在 69 种免疫细胞类型中系统开展了数量性状位点分析。研究共鉴定出 9600 个顺式 eGene 与 52,361 个顺式 caPeak ,其中 28.84% 的 eGene 与 55.19% 的 caPeak 表现出严格的细胞类型特异性,证实了免疫调控机制的高度背景依赖性。研究进一步揭示了跨染色体调控机制,在 45 种细胞类型中识别出 84 个反式 eGene ,其中 69.04% 具有细胞类型特异性。结合 B 细胞与单核细胞分化轨迹的动态 eQTL 分析显示, 32% 的 B 细胞顺式 eQTL 与 46.9% 的单核细胞顺式 eQTL 呈现动态调控特征。该研究系统构建了一个涵盖多种免疫细胞类型的顺式与反式表达数量性状位点及染色质可及性数量性状位点的完整图谱。
在疾病关联层面,为深入解析遗传变异影响免疫性状的调控机制,研究团队整合多组学数据与孟德尔随机化方法展开系统分析。尽管已有研究通过共定位分析发现部分 eQTL 与疾病位点存在关联,但非编码变异通过细胞类型特异性方式影响疾病易感性的完整路径仍待阐明。本研究采用基于统计摘要数据的孟德尔随机化方法( SMR ),整合了 154 种性状的 GWAS 数据,包括血浆脂质组、代谢组、血浆炎症蛋白及免疫相关疾病数据,进行多效性关联分析,在 68 种免疫细胞类型中共识别出 1196 个显著的 SMR 多效性关联,涉及 833 个遗传变异、 138 个 eGene 、 280 个 caPeak 和 68 种性状。值得关注的是, 73.2% 的关联仅存在于单一细胞类型, 67.6% 的变异、 46.7% 的分子特征与 23.5% 的性状表现出严格的细胞类型特异性。以 rs34415530 位点为例,该变异通过特异性调控 CD4 Treg-FOXP3 细胞中 IKZF4 表达,同时影响血浆 IL-12B 蛋白水平与哮喘易感性,完整揭示了遗传变异通过细胞特异性方式调控系统性免疫反应与疾病风险的路径,为理解免疫相关疾病的发病机制提供了重要线索。
图 2. CIMA 多组学研究摘要
在方法学创新上,为拓展人工智能在免疫多组学研究中的应用,研究团队基于 CIMA 数据开发了 CIMA 细胞语言模型。该模型整合染色质序列与单细胞基因表达数据,通过捕捉序列与表达模式间复杂的相互作用关系,实现对染色质可及性的精准预测。在 32 种免疫细胞类型的系统验证中, CIMA-CLM 预测的染色质开放区域与 scATAC-seq 测序结果高度一致,平均 Pearson 相关系数为 0.8951 , AUROC 均值达 0.9560 。该模型成功预测了多个疾病相关非编码变异对染色质可及性的影响效应,为系统性解析非编码基因组提供了新技术平台。后续,研究团队将基于人类基因组基础模型 Genos 与高质量的 CIMA 数据,发展能够解释基因表达动态调控可能性的细胞语言模型。
综上所述,本研究通过构建外周血免疫多组学图谱CIMA,系统解析了免疫系统的细胞类型特异性调控架构。研究不仅绘制了包含73种免疫细胞类型的高分辨率图谱,还揭示了从遗传变异到染色质状态、基因表达乃至临床表型的完整调控路径。研究显示,遗传调控效应具有细胞类型特异性,凸显了精细解析免疫调控机制的重要性。该资源为精准理解免疫多样性、探索免疫相关疾病的发病机制提供了关键理论基础,并将有力推动精准免疫学的发展与靶向治疗策略的研发。
基因组多维解析技术全国重点实验室刘传宇研究员、金鑫研究员、刘龙奇研究员、徐讯研究员和上海交通大学医学院附属瑞金医院曹亚南研究员为论文共同通讯作者,基因组多维解析技术全国重点实验室殷建华副研究员,中国科学院大学博士研究生郑宇辉、黄琢理、周雯雯,基因组多维解析技术全国重点实验室袁月博士、蔡鹏飞博士和白勇副研究员为该 论文共同第一作者。该成果获得了深圳市单细胞重点实验室、深圳市数字化细胞病理概念验证中心、山西医科大学 - 华大 未来医学 联合研究中心的支持。
专家点评
宁光(中国工程院院士,上海交通大学医学院附属瑞金医院院长)
基因组多维解析技术全国重点实验室与瑞金医院合作发表的人群免疫多组学图谱( CIMA ),通过分析超过 1000 万个细胞,系统性解析了遗传、年龄、性别等因素对免疫系统的精细作用和影响。该研究的发布,为复杂疾病的机制解析与精准防治,提供了至关重要的免疫学视角和数据支撑。 CIMA 也为内分泌和代谢性疾病的研究开辟了全新视野。免疫系统与代谢稳态的交互调控(即 “ 免疫代谢 ” )是当前生命科学领域的核心前沿方向,动脉粥样硬化、 2 型糖尿病等诸多疾病的发生发展,均伴随显著的免疫紊乱。 CIMA 所揭示的细胞类型特异性基因调控网络及遗传效应,为精准解答 “ 何种免疫细胞、通过何种通路、影响何种代谢功能 ” 这一关键问题,提供了重要的数据基石与研究示范。最后, CIMA 作为高质量的数据资源,可以预见,这一宝贵资源将与 ChinaMAP 等其他人群队列数据,通过跨学科、跨尺度的融合分析,最终为建立疾病风险预测、分型诊断及精准防治体系,贡献关键力量。
专家点评
程涛(中国工程院院士,中国医学科学院血液病医院(血液学研究所)所院长)
CIMA 研究对自然人群的外周血免疫细胞进行了大规模、多组学解析,构建了高分辨率的人群免疫参考图谱,是人群免疫研究的一项重要进展。该研究有三大突出价值:第一,系统揭示了人群免疫细胞在年龄、性别维度上的分子与细胞特征;第二,不仅在单细胞水平绘制了遗传变异对基因表达和染色质开放性的影响,更通过多组学整合,阐明了众多与免疫疾病风险相关的多效性调控位点,将遗传关联推向机制理解;第三,创新开发的 CIMA-CLM 智能模型,为从序列和表达信息预测染色质状态及评估非编码变异功能提供了新工具。这项工作与我们长期推动的 “ 血液细胞图谱( ABC )计划 ” 目标高度一致。 CIMA 贡献的高质量人群多组学数据,正是构建精准细胞参考目录的关键组成部分,极大丰富了 ABC 计划的数据资源。同时,其展现的大规模数据整合与智能分析范式,也与 “ 百亿细胞联盟( 10BC ) ” 所倡导的通过协同创新绘制全景细胞图谱、进而探索生命复杂系统的愿景相契合。 CIMA 的研究实践,为未来实现从 “ 绘制图谱 ” 到 “ 解析规律 ” 乃至 “ 模拟预测 ” 的跨越提供了扎实的探索。 CIMA 资源的开放共享,希望能与 ABC 计划、 10BC 联盟及国内外学界形成合力,共同推动血液与免疫研究的深化,为疾病精准诊疗奠定坚实基础。
专家点评
李汉杰(中国科学院深圳先进技术研究院 研究员)
这项工作以大规模的单细胞多组学数据为基础,系统绘制了外周血免疫系统的多维调控图谱。研究团队整合 scRNA-seq 、 scATAC-seq 、全基因组测序、代谢组和脂质组等多源信息,全面解析了性别、年龄和遗传变异对免疫系统分子特征的影响。这种 “ 全景式 ” 资源不仅在规模和分辨率上达到国际领先水平,更重要的是,在全球免疫组学图谱中,为东亚人群提供了系统而高分辨率的基础资源,为疾病易感性、免疫衰老与群体差异研究奠定了关键基线。
值得强调的是,研究团队通过构建增强子驱动的基因调控网络,揭示了免疫细胞的精细转录调控特征,并绘制了大规模 eQTL 与 caQTL 的细胞类型分辨图谱。通过 SMR 分析,研究将遗传变异与代谢组、炎症蛋白和免疫疾病风险精准关联,提出了一批具有功能意义的 “ 变异 — 细胞 — 性状 ” 轴线。这种跨遗传、表观、转录和代谢维度的整合,为理解免疫系统的多层级调控和疾病发生机制提供了重要参考,也有利于推动免疫遗传学研究从 “ 单点关联 ” 迈向 “ 系统网络解析 ” 的新阶段。
另外,研究团队开发的 CIMA-CLM 语言模型,将染色质序列与单细胞转录组深度融合,实 现了高精度的染色质可及性预测与变异功能效应模拟。这不仅是传统 QTL 分析的延伸,更是向 “ 虚拟免疫数字孪生 ” 体系做的重要尝试:通过在数字空间中重建细胞的调控状态与功能属性,未来有望在不依赖大量湿实验的情况下,对特定遗传变异、药物干预或免疫状态变化进行虚拟模拟与预测。这类技术有望成为免疫系统建模、疾病风险评估与靶点筛选的重要支撑。
这项工作在技术规模、分析深度和方法创新上均具有国际领先水平。 CIMA 资源的开放与扩展,有利于推动精准免疫学与群体遗传学的发展。一方面,该图谱为疾病风险研究和免疫干预提供了高分辨率的对照基线;另一方面,结合纵向队列、空间组学和蛋白质组学,并配合 CIMA-CLM 等 AI 模型,将有望推动虚拟免疫细胞的构建,实现对免疫状态的动态数字化重建。更为重要的是,该研究本身在构建人群免疫资源、揭示细胞类型特异调控机制和开拓多组学整合分析范式方面具有里程碑式意义,对推动免疫疾病机制研究和精准医学转化具有重要意义。
https://doi.org/10.1126/science.adt3130
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴