↑↑↑关注柳叶刀学术↑↑


文来源:深圳医学科学院

何以为「糖」?北京时间 2024 年 12 月 16 日,颜宁团队在预印本网站 BioRxiv 公布最新成果 The 8-nm spaghetti: well-structured glycans coating linear tetrapeptide repeats discovered from freshwater with CryoSeek(《8 纳米意大利面条:利用酷寻在淡水中发现的包围着四肽重复序列蛋白丝的规则糖质结构》)。事实上,这篇研究论文是研究团队即将发表在《美国科学院院刊》(PNAS)的一篇相关论文的姐妹篇。

打开网易新闻 查看精彩图片

此前,颜宁团队报道了莱茵衣藻纤绒毛 (mastigoneme) 复合物的高分辨率结构,发现复合物中有大量与羟脯氨酸相连的阿拉伯聚糖,后者在整个复合物的组装中发挥重要作用。该研究首次揭示了聚糖的高级结构,同时提示选择合适的生物体系能够对糖质的结构生物学研究取得意想不到的突破。

与该工作同期开展的,还有一项被颜宁团队称为 「 荷糖月色 」 计划的研究 —— 通过 「CryoSeek(酷寻)」 这一研究策略,将冷冻电镜作为一种观察工具,用于发现完全未知的生物大分子。结合冷冻电镜分析、AI 辅助的自动建模以及生物信息学分析,颜宁团队在今年 10 月份报道了来自清华大学荷塘中一种新型的纤维蛋白的结构和潜在功能。然而,团队特意用了 「 荷糖月色 」 作为新闻标题,这并不是别字,而是有意为之,因为与此同时,团队还有更加有趣的发现,正在进行下一步的验证。

不同于之前可以利用 AI 自动搭建出模型的、以蛋白质为主的两个疑似未知菌毛的结构,在这两个后续研究中,AI-助力的若干软件都无法自动搭建出蛋白结构。经过人工手动尝试,才发现原来是一种高度糖基化的蛋白纤维 。

通过经验丰富的科研人员对电子密度图进行分析,揭示出这一直径约为 8 nm 的纤维的中心是一条细长的线性多肽,也是整个纤维中唯一属于蛋白的部分。这一部分由简单的四肽重复序列组成。神奇的是,每个四肽重复片段包含一个保守的 3,4-二羟脯氨酸 (3,4-dihydroxyproline, DiHyp) ,其 3-OH 与 4-OH 均高度 O-糖基化。与 DiHyp 相邻的位置,还存在一个 O-糖基化的丝氨酸或者苏氨酸。

在三维重构的区段中,纤维结构高度规则,其折叠形式完全由糖质间的相互作用维持。意即,蛋白在这个高维结构中只是一种线性存在,其结构的组装与成型完全依赖于糖质的相互作用。并且由于高重复性,这些糖质的组装也是高度有序的。

通过计算氨基酸和糖质的比例发现,该纤维结构中糖质的质量占比达到了惊人的 95% 以上,因此科研人员在英文中将之类比为意大利面或者米线;考虑到荷塘的复杂环境,酷爱螺蛳粉的颜宁教授更愿意在中文语境下称之为 8 纳米螺蛳粉(一纳米为百万分之一毫米,头发的直径大约为 60-90 微米,所以这些纤维丝大约为万分之一的头发丝直径)。

本研究衍生出诸多有趣的问题等待探索。比如,如此高度有序的结构是由哪些糖基转移酶催化的?在组装过程中是否需要特定的伴侣蛋白或其他辅助因子?最重要的是,这些在细胞体外的纤维丝为糖基的存储几乎提供了无限空间,从而成为一种有效调节微环境里碳氮平衡的手段。探索这些问题需要在实验室内建立合适的模式生物,还有赖于包括结构信息学在内的多种策略;而这些问题的解决则将为包括合成生物学、材料科学在内的诸多学科提供新思路和新手段。

清华大学讲席教授、北京生物结构前沿研究中心研究员、深圳医学科学院创始院长、深圳湾实验室主任颜宁和清华大学生命科学学院助理研究员李张强为本文的共同通讯作者。清华大学生命科学学院 2020 级直博生王彤彤、2023 级博士生孙熠彤为本文共同第一作者。实验的冷冻电镜数据收集得到了清华大学冷冻电镜平台的帮助。实验的质谱鉴定工作得到了蛋白质化学与组学平台的支持,实验的计算工作得到清华大学高性能计算平台、国家蛋白质设施实验技术中心(北京)的支持。本研究得到了国家自然科学基金重大研究计划,北京生物结构前沿研究中心与清华-北大生命科学联合中心的经费支持。

论文链接:

https://biorxiv.org/cgi/content/short/2024.12.15.627649v1