转自:劳动午报
在中国科学院北京基因组研究所(国家生物信息中心),国家基因组科学数据中心副主任宋述慧是出了名的 “能战、善战、胜战”。在基因数据领域深耕十余载,宋述慧和同事们将一组组“神秘”的基因数据“收编入库”,建立起中国人自己的数据系统。从陪跑到并跑再到领跑,一路走来,困难重重,宋述慧从未轻言放弃。她说:“国之所需,心之所向。为国家的繁荣昌盛贡献科技力量,是青年科学家义不容辞的责任。”
打破桎梏 建立中国人自己的基因数据系统
在信息时代的浪潮中,大数据已成为国家的战略资源,生命组学大数据更是如此。
作为中国科学院北京基因组研究所(国家生物信息中心)的一员,宋述慧从入职起便从事生物大数据科学与技术研究。“起初,我国学者需要将基因测序数据提交到欧洲、美国、日本的相关机构,才能在国际重要学术刊物发表论文。”宋述慧介绍。要实现科技自强自立,必须建立属于中国人自己的数据资源体系。
为此,2016年,中国科学院北京基因组研究所成立生命与健康大数据中心,开始建立我们国家自己的生物信息大数据资源体系。
如何做?谁来做?做什么?面对一系列问题,宋述慧带领团队从零开始,一点一滴地搜集信息、整理数据,如同为建设高楼打下地基。
“生物信息大数据不仅包括人体的基因数据,还包括动植物、病原微生物等,看似不起眼的小数据,汇聚在一起就有了大能量。”谈起自己的专业,宋述慧侃侃而谈。她说,对于人类而言,研究人体基因数据有助于分析人类疾病,帮助人们实现高品质生活。中国作为粮食大国,粮食安全至关重要,有了农作物基因数据库,科学家就能“找”出最适合中国气候环境生长的农作物,甚至可以进行更加精细化的分析,比如哪类大豆更适合做豆浆,哪类大豆更适合用来制作动物饲料……这些数据分析将对育种起到支撑、指导、参考作用。
经过几年的不懈努力,宋述慧带领团队建立了我国具有自主知识产权的基因组序列变异“数据-信息-知识”资源库和表型归档库。这一成绩的取得,不仅解决了长期困扰我国的“卡脖子”问题,更为生命科学研究提供了坚实的数据支撑。宋述慧团队建立的遗传变异信息库GVM,与国际知名的dbSNP、EVA和GWAS Catalog数据库相媲美,被国际Cell出版集团推荐为变异数据归档库。
数据的价值在于应用。宋述慧还带领团队攻克了大规模数据组织管理的技术难题,发展了一系列关键技术,建立了统一的变异组数据和关联知识共享管理体系,这一体系不仅服务于国内研究,更吸引了来自92个国家/地区的众多用户,数据下载次数超过千万。我国在生物信息学领域的国际影响力从陪跑逐渐转为并跑、领跑。
科技抗疫 搭建新冠病毒演化研究全新算法
新冠疫情期间,宋述慧团队监测病毒演变规律,力求实时跟踪病毒变异,为新冠疫情防控研判提供有力数据支撑。
“新冠病毒的传播演化,超过了有记录以来的任何一种病毒。想要打赢新冠病毒,就得找到病毒的‘痛点’,这时候数据分析就显得尤为重要。”宋述慧回忆,当时已有软件,分析一条数据大概需要几秒钟,但是疫情防控期间,每天大约有数百甚至数万条序列数据从各方汇聚而来。随着数据的快速累积,已有近1700万条左右的数据,而当时的演化分析软件尚不能支持海量数据的快速解析。时间就是生命,必须要有更新、更快的分析软件才行。
作为新型冠状病毒攻关团队变异组负责人,宋述慧带领团队快速进入了应急攻关新常态的工作模式,争分夺秒建成新冠病毒信息资源库,建立了全球新冠病毒序列变异自动化实时解析及动态演化监测追踪的分析方法,将分析速度提升到了20分钟500万条,大大提升了效率。截至2024年2月29日,RCoV19已服务全球181个国家/地区约40余万名访客,数据累计下载近112亿条。这项研究成果入选2020年度“中国生物信息学十大进展”、中国科学院2021年度科技创新亮点成果、2022世界互联网大会——科技之魅领先科技成果。
“新冠疫情防控充满艰辛与挑战,有段时间大家居家办公,工作起来不分昼夜,常常一边吃饭一边分析数据。”宋述慧感慨,历尽千帆,破浪前行,经过三年的打磨,团队已经建立起了数据整合、快速解析、演化监测追踪与预警预测的全链条底层框架及技术体系,为应对未来可能存在的突发情况提供了可借鉴的数据及经验。
立德树人 基因科普进万家
科学的力量在于普及。宋述慧不仅在数据库里追求基因的奥秘,更致力于将科学的种子播撒到更多渴望知识的心灵中。
基因组科学不仅仅是高高在上的学术研究,更是关乎每个人健康与未来的实用知识。为了让更多人了解基因的奥秘,认识到基因与日常生活的紧密联系,宋述慧积极参与院所科普小组活动,走进中小学校园、科技馆等,用通俗易懂的语言为孩子们揭开基因的神秘面纱。在她的科普讲座中,基因不再是枯燥的生物学术语,而是一个个生动的故事。她讲述基因的发现历程,介绍基因组测序的技术,解释基因如何影响人们的健康和行为,用互动和动画的方式,让孩子们亲身体验“小小科学家”的角色,激发学生对科学的热爱和好奇心。
宋述慧还通过线上节目和科普书籍《写给孩子的科技前沿》,将基因组科学的种子撒向更广阔的天地。她的报告和书籍不仅涵盖了基因的基本知识,还介绍了我国及世界上具有代表性的生命科学工程项目,如人类基因组计划、水稻基因组计划等,展示了基因组科学的最新成果和应用前景。
宋述慧的科普事业如同春风化雨、润物无声,她用实际行动诠释了科学的精神,用知识的力量照亮了更多人的心灵。在她的影响下,越来越多的人开始关注和理解基因组科学,越来越多的青少年立志投身于科学的海洋。她培养的硕士研究生、博士研究生,不仅成为基因数据研究领域的新生力量,也传承着她的科普精神。
□本报记者 孙艳
热门跟贴