东北大学的研究人员使用了一种新型机器学习工具来预测基因突变如何导致一种被称为OTC缺乏症的罕见代谢疾病,揭示了一些潜在的生化机制,并为未来的治疗奠定了基础。

鸟氨酸转氨酰化酶(OTC)缺乏症是一种遗传性疾病,影响了身体安全排除氨的能力,氨是细胞正常代谢蛋白质时产生的副产品。氨的积累可能是有毒的,可能导致严重的伤害,包括大脑或肝脏损伤,甚至死亡。

东北大学化学与化学生物学的Mary Jo Ondrechen教授和Penny Beuning教授领导的研究团队将他们的原创机器学习工具——部分序列最优似然法(Partial Order Optimum Likelihood,简称POOL)与生化实验相结合,研究了OTC基因中的数十种突变。该基因产生OTC酶——一种加速化学反应的蛋白质——是将氮转化为尿素过程中的一个环节,以便身体可以通过尿液排出。

Beuning教授表示:“Ondrechen教授的机器学习方法在预测突变对蛋白质功能的影响方面非常有效。这是我们第二次使用这种方法分析与疾病相关的酶的数百种突变,两个案例中的实验分析都表明预测是准确的。”

这项研究发表在ACS Chemical Biology上,阐明了某些突变如何破坏酶的正常活动。对疾病机制更深层次的分子理解是未来开发个性化治疗的重要一步。

理解OTC缺乏症及其影响

理解OTC缺乏症及其影响

“现在我们根本上在问,‘这个突变为什么有害?它为什么会导致疾病?’”Ondrechen说。“然后你可以尝试考虑一种药物,一种小分子,它会与蛋白质结合并抵消突变的影响。”

每年大约有14,000到77,000人被诊断为OTC缺乏症。这种疾病的严重形式通常会在出生后不久影响一些新生儿,尤其是男孩。较轻的形式可能在儿童期或成年期出现。

“在马萨诸塞州,每个婴儿都会接受多种遗传突变的检测,包括OTC缺乏症,”Ondrechen说。

症状的严重程度各异,可能包括呕吐、疲劳、癫痫发作、发育迟缓以及精神问题。目前的治疗方法侧重于通过低蛋白饮食、去除多余氮的药物以及在严重情况下进行肝脏移植来管理氨水平。

探索基因突变及其影响

探索基因突变及其影响

人类基因突变数据库显示,OTC基因中已知有486种突变。其中332种突变涉及DNA的一个构建块的变化,可能会削弱或完全失去酶的功能。

“也有可能只有一些突变实际上降低了酶的活性,”Beuning说。“其中一些是随机出现的,并且与疾病无关,即使它们在一个人的细胞中被发现。”

在实验中,研究人员发现了一些意想不到的结果:一些与疾病相关的突变在试管实验中表现正常,但在活细胞中测试时却变得受影响。

研究人员专注于酶中特定的氨基酸,这些氨基酸可以打开或关闭它们的电荷——这个特性使得蛋白质能够催化化学反应。他们计算了一种称为μ4的度量,描述了这些带电氨基酸与其周围环境的相互作用强度,并帮助预测哪些基因突变可能干扰酶的功能。

“机器学习方法的一个好处是缩小突变的范围,以识别最可能改变OTC活性的突变,”Beuning说。

POOL学习生物数据中的模式——例如,哪些突变更具破坏性——即使科学家对每个案例的信息并不完整。它会根据现有证据预测哪些变异可能会产生更强或更弱的影响。

机器学习揭示新的见解

机器学习揭示新的见解

科学家们选择了17个与疾病相关的突变和一个额外的突变进行详细研究。半数被预测会通过直接损害酶的功能导致疾病,另一半则是通过其他机制。

POOL结合μ4分析能够正确预测在18个突变中,有17个阻碍了酶的工作。大多数在试管中未阻碍酶的突变在细胞中却阻碍了酶的功能。

团队在分析了细胞培养中受影响的酶后,提出了关于疾病发展的可能解释。

Beuning表示:“我们进行这项研究的规模如果没有我们博士生的创新,这项研究是无法实现的。他们非常专注的努力使我们能够获得酶并在实验室中研究其突变,以确定突变在分子水平上的影响。”

研究结果表明,μ4测量可以作为现有生物信息学工具的补充,用于预测突变如何影响酶的活性。

下一步和持续的研究问题

下一步和持续的研究问题

Ondrechen表示,研究已经揭示了一些原因,说明某些突变如何直接影响酶加速化学反应的能力。下一个挑战是理解为什么其他突变虽然不直接影响催化,却仍然导致疾病。

“这是更棘手的问题,这正是我们现在追求的目标,”她说。

Beuning说,有很多可能的解释,比如细胞制造的蛋白质数量,以及它与途径中其他蛋白质的相互作用。

“我们现在正在努力理解这些对酶活性有影响的其他因素,以确定这些不同的突变是如何影响活性的,当然,这些因素可能因突变而异,”她说。