撰文丨王聪
编辑丨王多鱼
排版丨水成文
近日,西湖大学的一项研究论文登上了Cell Press官网头条。
该论文以:Genetic control of non-coding RNAs in the human brain and their implications for complex traits(人类大脑中非编码 RNA 的遗传控制及其对复杂性状的影响)为题,于 2025 年 12 月 16 日发表于 Cell Press 旗下期刊The American Journal of Human Genetics上,通讯作者为西湖大学生命科学学院杨剑研究员。
该研究通过对 2865 个人类大脑皮层样本的 RNA 测序(RNA-seq)数据分析,鉴定出 38441 个长链非编码 RNA(lncRNA)和 23548 个环状 RNA(circRNA),其中 27453 个 lncRNA 和全部 circRNA 未被 GENCODE 数据库收录。表达数量性状基因座(eQTL)分析确定了 15362 个 lncRNA 和 1312 个 circRNA 的顺式 eQTL。研究发现,lncRNA 或 circRNA 的 eQTL 与其相邻或亲本蛋白编码基因(PCG)的 eQTL 具有相对独立性,且平均效应更大。circRNA-eQTL 在经典剪接位点显著富集,凸显了反式剪接在 circRNA 生物合成中的重要作用。lncRNA-eQTL 与大脑相关复杂性状的遗传力存在富集关联,并与 72 个(11.2%)共定位的全基因组关联研究(GWAS)信号相关。
该研究还展示了可能通过非编码 RNA(ncRNA)遗传调控影响复杂性状的 lncRNA(例如 VPS45、MAPT 和 RGS6 邻近的 lncRNA)和 circRNA(例如 GRIN2A 相关的 circRNA)。该研究为 ncRNA 的遗传调控机制及其在大脑相关复杂性状中的作用提供了新见解。
全基因组关联研究(GWAS)已确定了大量与人类复杂性状相关的遗传变异。尽管有了这些发现,但要破译全基因组关联研究信号背后的分子机制仍是一项艰巨挑战。
大多数与性状相关的变异位于非编码区,这表明它们可能通过基因调控来影响性状。数十年来的研究已对 RNA 转录和剪接的遗传控制有了广泛了解。影响基因表达和剪接的遗传变异体,分别被称为表达数量性状基因座(eQTL)和剪接数量性状基因座(sQTL),几乎与所有基因都有关联。这些 eQTL 和 sQTL 数据已被用于研究通过 GWAS 发现的复杂性状的遗传关联是否由基因表达的遗传调控所介导。
这些努力为通过 GWAS 所识别的遗传关联信号的分子基础提供了宝贵见解,然而,这些遗传关联中仍有很大一部分未得到解决,从而导致了“缺失环节”问题。
非编码 RNA(non-coding RNA,ncRNA),例如长链非编码 RNA(lncRNA)和环状 RNA(circRNA),在人类大脑中大量存在,并在基因表达调控中发挥着关键作用。这些 ncRNA 的紊乱可能会导致严重的神经功能障碍。
在近期的研究中,lncRNA 和 circRNA 与人类复杂性状的关联已日益受到重视。例如,GTEx 数据已被用于研究 14100 种已注释的 lncRNA 在 49 种人体组织中的遗传调控,确定了 101 种复杂性状的 1432 种 lncRNA-性状关联。
尽管取得了这些进展,但针对大脑中 ncRNA 的遗传关联研究仍存在明显不足,这在很大程度上是由于样本量有限,导致 lncRNA 和 circRNA 在大脑相关性状和疾病中的作用大多未得到明确描述。此外,以往的研究主要集中在从 GENCODE 等参考文献中注释的蛋白质编码基因(PCG)和 ncRNA 上,而对于未注释的转录本,尤其是 lncRNA 和 circRNA 等 ncRNA 的遗传控制机制则研究不足。
在这项研究中,研究团队利用来自 2443 名无血缘关系的欧洲裔个体的 2865 个大脑皮层样本,构建了长链非编码 RNA(lncRNA)和环状 RNA(circRNA)的广泛表达数量性状基因座(eQTL)目录,揭示了 15362 个 lncRNA(eLncRNA)和 1312 个 circRNA(eCircRNA)的顺式 eQTL(
cis- eQTL );值得注意的是,其中 7005 个 eLncRNA 对应于 GENCODE 中未收录的 lncRNA,因此在基于这些注释的先前 eQTL 研究中无法对其进行评估。
该研究还发现了 15362 个 lncRNA 的 1519782 个独特的
cis-eQTL 单核苷酸多态性 (SNP) 以及 1312 个 circRNA 的 101203 个独特的
cis-eQTL 单核苷酸多态性 (SNP) 。表明了 lncRNA- eQTL 和 circRNA- eQTL 分别占 14 种大脑相关复杂性状(包括疾病)基于 SNP 遗传力的平均 11.14% 和 3.20%,相比之下,蛋白质编码基因(PCG)- eQTL 估计占 17.19%。
研究团队进一步整合了 lncRNA-eQTL 和 circRNA-eQTL 数据与全基因组关联分析(GWAS)的汇总统计数据,以识别与大脑相关性状存在关联的 lncRNA 和 circRNA,因为它们存在共同的遗传调控机制,进而发现了 795 个与这些性状相关的 lncRNA 和 8 个 circRNA。
总的来说,这项研究提供了大脑皮层中大量的 lncRNA 和 circRNA 及其相应的顺式表达数量性状基因座(
cis-eQTL) ,这有助于更深入地理解大脑皮层中基因表达的遗传调控,并弥合大脑相关疾病遗传关联与其病理生理机制之间的差距。
论文链接:
https://www.cell.com/ajhg/fulltext/S0002-9297(25)00437-9
热门跟贴