近日,由华大生命科学研究院牵头提出并起草的两项国家标准——GB/T 46927-2025《时空组学 数据集格式规范》与GB/T 46935-2025《单细胞测序 单细胞转录组数据集》正式发布,并将于2026年7月1日起实施。
这标志着我国在时空组学与单细胞组学领域建立了多维数据标准化体系,将为构建人工智能模型、解析疾病机制等创新应用提供高质量数据支撑,成为驱动生命科学研究范式创新的核心基石。
生命大数据,可以说是天然自带复杂属性:维度多、体量足、跨学科特性强。这就像不同实验室使用了不同的语言记录数据,彼此无法顺畅沟通,极大阻碍了数据价值的挖掘与共享。
一方面,单细胞测序技术以揭示细胞异质性为核心,其数据具有海量、稀疏且高度异构的特点;另一方面,作为新型交叉领域的时空组学技术,进一步在时间和空间维度上解析生命奥秘,其产生的数据量更为庞大且格式复杂。
而本次两项国家标准的联合发布,就像为生命科学数据制定了“通用语法”,打通了数据采集、存储、共享的全链路,确保了海量数据的高质量与一致性,让这些前沿技术在赋能科学研究与应用进程中能够真正释放潜能。
多机构协同,引领行业规范化发展
两项标准由华大牵头,联合国家生物信息中心、深圳大学、鹏城实验室、中国测试技术研究院、之江实验室、中山大学等数十家机构共同起草,汇聚了行业内众多权威专家的智慧,确保了标准的科学性与实用性。
GB/T 46927-2025《时空组学 数据集格式规范》
文件明确了时空组学数据集的存储及格式要求,包括时空组学的元数据、数据文件及数据存储目录,为时空组学数据的规范化存储与共享划定了准则。
GB/T 46935-2025《单细胞测序 单细胞转录组数据集》
文件覆盖了单细胞转录组数据的范围界定、数据及数据文件格式要求、数据元目录和归档目录的规范化定义、数据安全管理的要求,适用于组学数据中有关单细胞转录组数据的存储、管理、交换和共享。
*两项标准均由全国生化检测标准化技术委员会(SAC/TC 387)提出并归口,主管部门为国家标准委。
西北农林科技大学姜雨教授表示:“这两项国家标准的出台,不仅填补了国内在时空组学与单细胞组学领域标准化的空白,标志着我国在生命科学前沿技术标准化建设上占据了制高点,更为进一步制定国际标准奠定了基础,将有力促进相关产业的快速、健康、稳定发展。”
技术筑基,硬核实力支撑标准落地
标准的制定离不开技术的支撑,华大在生命科学前沿领域的持续突破,为标准落地筑牢了根基。近年来,华大牵头研发的多项突破性技术接连登上国际顶级期刊,不断引领行业进步,驱动产业发展。
2025年8月,华大生命科学研究院牵头建设的基因组多维解析技术全国重点实验室联合多家顶尖机构共同开发,在国际顶级学术期刊《细胞》(
Cell)发布。该技术如同一把万能钥匙,打开了全球各地大量存档临床样本的“黑匣子”,推动生命科学研究从“看见细胞”迈向“看懂细胞与微生物战场”的精准医学新时代。
Cell官网截图
同月,基因组多维解析技术全国重点实验室联合多家机构,在国际顶级学术期刊《科学》(
Science)发布,颠覆性实现多模态整合、原位动态捕捉、极限样本兼容、百万级通量等技术突破,彻底打破了传统单细胞测序技术局限,有望为规模化开展细胞病理、发育与衰老、免疫与疾病、动植物遗传与进化等前沿研究提供强有力的支撑。
Science官网截图
2026年1月,基因组多维解析技术全国重点实验室联合上海交通大学医学院附属瑞金医院、山西医科大学等多家机构在《科学》(
Science)发布 。基于该图谱研发的“CIMA细胞语言模型”AI解决方案,能够为疾病机制研究和药物靶点发现提供智能辅助。
目前,规模更大、覆盖疾病队列更系统的CIMA二期计划已正式启动,将重点应用Stereo-cell细胞组学技术和蛋白多重检测技术等前沿平台,旨在系统解析疾病发生发展的免疫学机制,挖掘新型诊疗靶点,并为构建高精度的“虚拟细胞”模型、实现疾病模拟与干预策略的数字化预测提供高质量的数据资源。
CIMA多组学研究摘要
从时空组学到单细胞组学,从标准制定到技术革新,从图谱绘制到AI建模,华大正逐步构建覆盖“数据规范-技术平台-图谱资源-模型应用”的生命科学全领域完整生态,将有力推动科研探索向临床与产业转化落地,持续赋能精准医疗、药物研发与健康产业发展。
未来,两项国家标准的正式实施将进一步推动生命科学领域的规范化发展,加速科研成果向临床转化,让前沿技术更好地服务于全民健康。华大也将持续深耕生命科学领域,推动“科学发现-技术发明-产业发展”联动,书写更多科技创新篇章。
让我知道你“在看”
热门跟贴