Nature子刊：崔庆华团队开发新型AI算法，实现人类蛋白质重要性的预测分析|protein|实验|崔庆华|算法|细胞系|蛋白质

编辑丨王多鱼

排版丨水成文

人类必需蛋白（Human essential protein，HEP）对于个体的生存和发育是必不可少的。然而，鉴定HEP的实验方法往往昂贵、耗时和劳动密集型的，例如CRISPR-Cas9基因敲除实验及基因过表达实验，且这些实验方法难以推广到人类全蛋白质组。

因此，亟需计算方法来快速准确预测人类全部蛋白质的重要性，但现有的计算方法只能在人源细胞系水平预测HEP，而实际上，HEP在人类、细胞系和动物模型中存在高度差异性。这就要求我们在设计预测算法时，不仅需要提升算法的预测精度，还要需要考虑蛋白质重要性存在的变异性。

近年来，深度学习（Deep Learning，DL）和大语言模型（Large Language Model，LLM）技术的快速发展，为蛋白质重要性预测提供了新思路。

2024年11月27日，崔庆华团队在 Nature 子刊Nature Computational Science上发表了题为：Comprehensive prediction and analysis of human protein essentiality based on a pre-trained protein large language model 的研究论文。

该研究通过微调预训练的蛋白质语言模型，开发了一个基于序列的深度学习模型——蛋白质重要性计算器（Protein Importance Calculator，PIC），实现人类蛋白必要性/重要性的综合预测和分析。

该研究提出的PIC算法相较于此前最先进的计算方法DeepCellEss获得显著性能提升（AUROC和AUPRC分别提升9.64%和10.52%）。

除了具有优异的性能外，PIC算法是首个可以同时预测蛋白质在人体、人源细胞系和小鼠中的重要性评分的工具，能够为人类所有蛋白质的重要性进行综合的预测评估。在案例研究中，研究团队使用PIC算法成功预测了人类乳腺癌中的关键蛋白质靶点，并证明了其作为乳腺癌患者预后标志物的价值。

最后，研究团队使用PIC算法首次为617462种人类微蛋白（Human microproteins）的重要性进行了预测，这将为微蛋白的研究提供有力帮助。

北京大学基础医学院医学生物信息学系博士生康伯铭和已毕业博士樊锐为论文共同第一作者，崔庆华教授（现为武汉体育学院教授）为论文通讯作者，北京大学基础医学院为论文第一单位。

论文链接：

https://www.nature.com/articles/s43588-024-00733-1

Nature子刊：崔庆华团队开发新型AI算法，实现人类蛋白质重要性的预测分析

热搜

热门跟贴

热搜

热门跟贴

相关推荐

新AI模型提高与疾病相关基因组学的预测能力

精确属性控制，湖大、西电从头药物设计AI方法，登Nature子刊

Nature：靶向蛋白降解四大创新方向

人工智能：科学发现未来的创新者

为了能当领导，我爸给我报的每个志愿都是「人力资源管理」｜梁彦增 一席

连发四篇Nature子刊，湖南大学宋国胜/张晓兵团队在分子影像研究中取得一系列重要进展

谁也没想到，全球AI大发展，却突然发现被中国卡脖子了

AI：内容疑似人类生成

PaddleScience——击破科学计算痛点，让AI与科研无缝融合

外网播放过亿的视频，看到最后才知道，原来这是AI的杰作

活久见！全球首个被人类骗走近5万美元的AI诞生！马斯克直言：有点意思

当年美国遏制中国太空科技，如今却在人工智能领域被反向遏制

以后人类不生病了！中国社科院学部委员：外科医生将被AI淘汰，如果你今年不到60岁做好永生准备【附中国AI医疗行业前景】

对未来的想法：写在ChatGPT诞生两周年之际

Ai对人的影响有多大

如虎添翼！西湖大学开发全新递送系统，让CRISPR基因编辑更高效

国自然「榜一」名不虚传，竟然还能联合铁死亡这么用

马斯克称脑机接口能解决大多数疾病，大规模量产后成本将与手机相当

国自然撰写：经典分子机制研究（一）

Cell子刊：爱情会在大脑留下化学印记，而分开太久会导致这种印记消失

为了能当领导，我爸给我报的每个志愿都是「人力资源管理」｜梁彦增一席