RNA病毒是遗传多样性最丰富、进化速度最快的一类微生物,能够引发多种人类、动物和植物感染性疾病,对全球公共卫生与生物安全构成持续威胁。解析RNA病毒蛋白的三维结构,是理解病毒感染与免疫逃逸机制、指导抗病毒药物和疫苗研发的关键基础。然而,受限于蛋白结构解析技术等因素的限制,目前实验解析的RNA病毒蛋白结构仍然十分有限。
近日,上海交通大学等团队合作在bioRxiv预印平台发布了“RNA病毒蛋白结构数据库”(RNA Viral Protein Structure Database,RVPSD)。该数据库基于人工智能结构预测技术,系统整合了大规模RNA病毒蛋白三维结构数据,填补了RNA病毒蛋白结构资源分散、缺乏统一平台的空白,为病毒结构生物学研究提供了专业、开放的一站式资源平台。RVPSD数据库访问地址:https://virus.9itsg.net/#/home。
RVPSD共收录154,716个RNA病毒蛋白结构,覆盖5,263种RNA病毒和149个病毒科,是目前最大的RNA病毒蛋白结构数据库。所有蛋白结构均基于AlphaFold2预测获得,其中84.9%的结构具有较高结构置信度(pLDDT>70)。数据库在分类和功能注释层面均具有广泛覆盖,既包括黄病毒、小RNA病毒、冠状病毒等公共卫生高度关注的病毒科,也涵盖大量研究较少的新发现或未充分注释表征的RNA病毒。
为了方便用户使用的、面向下游结构分析,RVPSD数据库整合了病毒分类信息、核酸与蛋白序列、功能注释及结构预测结果,并支持基于序列和结构的双模式检索。用户可通过BLASTP进行序列比对,也可利用Foldseek进行结构相似性搜索,并在网页端通过交互式三维可视化工具直接查看蛋白结构细节。数据库还提供PDB格式文件下载,满足多样化研究需求。
图. 基于AlphaFold2的结构预测流程、pLDDT值分布及RVPSD应用示例
作为首个整合跨RNA病毒类群、大规模高置信度AI预测蛋白结构的专业数据库,RVPSD将病毒分类信息、核苷酸/蛋白序列、功能注释与蛋白三维结构数据有机整合,为RNA病毒的结构生物学研究奠定了基础。该数据库的上线,不仅为病毒进化、宿主相互作用研究提供了全新的支撑资源,也将为抗病毒药物和疫苗开发提供重要的结构数据,助力全球新发及再发病毒性传染病防控。
上海交通大学史卫峰教授、师咏勇教授和山东第一医科大学李娟教授为论文的共同通讯作者,上海交通大学杨强震博士、科研助理田忠帅和山东第一医科大学胡弢教授为共同第一作者。上海交通大学硕士生娄江溶、助理研究员刘恒聪为本论文合作者,悉尼大学Edward C. Holmes教授对本研究提供了指导。本研究得到上海交通大学医工交叉重点项目(YG2023ZD01)、国家自然科学基金(32325003、32370724、82472254)、国家重点研发计划(2023YFC2307503)等项目的资助。
热门跟贴