编辑丨王多鱼

排版丨水成文

深度学习(Deep Learning)在糖蛋白组学(glycoproteomics)的高通量谱库构建中展现出巨大潜力。然而,由于完整 N-糖肽(N-glycopeptide)结构复杂且信息维度高,其结构光谱的精确预测仍面临挑战。

2026 年 5 月 18 日,西北大学生命科学学院孙士生教授团队在 Nature 子刊Nature Machine Intelligence上发表了题为:SpecGP as a transformer-based model for predicting energy-adaptable structural spectra of glycopeptides 的研究论文。

该研究开发了一个基于 Transformer 的模型——SpecGP,用于预测糖肽(glycopeptide)的能量适应性结构光谱

打开网易新闻 查看精彩图片

在这项最新研究中,研究团队提出了一个基于 Transformer 的模型——SpecGP,采用注意力增强的糖质片段编码策略与多层感知器,实现精准的糖肽谱预测。该模型通过扩展碎片离子覆盖范围,在保持高预测精度的同时,提升了糖肽间的谱图区分能力。通过预测多个碰撞能量下的质谱图,SpecGP 最大化关键诊断离子的检测,并确保与多样化实验数据集的广泛兼容性。此外,其双任务框架还改进了保留时间预测。

打开网易新闻 查看精彩图片

在应用中,SpecGP 通过自监督加权训练策略有效增强异构体区分能力,并借助重评分提升糖肽鉴定效果。多能量谱中动态变化的互补诊断离子可进一步强化并验证糖质结构判别能力。

论文链接

https://www.nature.com/articles/s42256-026-01246-4