中国和美国的研究人员开发了一种新的人工智能模型,可以帮助克服药物开发和发现中的障碍。这种名为ActFound的新人工智能模型优于竞争对手的模型,并已被证明是一种比传统生物活性预测方法更具成本效益的替代方法。

打开网易新闻 查看精彩图片

生物活性包括化合物与生物靶点的相互作用、对系统的影响和治疗结果。预测生物活性对于从大量候选化合物中识别潜在的有用化合物至关重要,可以节省药物开发和实验的时间和成本。

将人工智能(AI)和机器学习(ML)应用于生物活性预测的主要挑战源于数据标记不足和测定之间的不一致,这些测定是评估药物活性或效力的测试。

来自华盛顿大学、北京大学和人工智能科技公司上海INF科技的研究小组在《自然机器智能》杂志上发表的一篇论文中详细介绍了这一新模型。

新模型不仅优于其他竞争的人工智能模型,而且还具有自由能摄动(FEP)的功能,这是一种成熟的传统计算方法,用于药物发现。

研究人员强调,FEP计算对计算资源的要求很高,因为它们“需要大量的计算资源,而这些资源对于大规模应用来说往往是负担不起的”。虽然FEP方法提供了极好的准确性,但这种方法通常需要难以捉摸的数据,并且需要昂贵的设备和广泛的实验室程序才能获得。

打开网易新闻 查看精彩图片

使用ActFound,研究人员能够使用更少的数据点,同时保持较高的准确性。这使得它成为比FEP更便宜的选择。

华盛顿大学的通讯作者、助理教授Wang Sheng说:“结果表明,ActFound可以成为一种有效的生物活性基础模型,用于各种类型的工作。”

人工智能一直被认为可以促进制药行业的蓬勃发展。该行业的几个主要参与者正在利用人工智能的力量来缩短开发时间。人工智能使他们能够比以往更有效、更经济地评估化合物的生物活性。

由于每次测定中检测的化合物数量有限,ML方法经常与生物活性预测作斗争。现有的分析数据也可能存在不一致性,这使得模型很难从一种分析生成另一种分析。基础模型是在大型和多样化的数据集上预先训练数据,可以克服这一挑战,因为它们可以更有效地对新的和未标记的数据进行预测。

使用这种方法,ActFound可以对来自可靠且知名的化学数据库的35,644个分析和160万个实验测量的生物活性进行训练。这有助于提高模型的准确性、通用性,以及在生物活性预测中捕捉复杂模式的能力。

研究人员使用了两种机器学习方法:元学习(meta-learning)和成对学习(Pairwise-learning)。

元学习方法使模型能够利用大量分析得出的知识,在数据有限的情况下做出预测。这对药物发现至关重要,因为产生大量生物活性数据可能既昂贵又耗时。

成对模型的作用是通过比较化合物之间的相对关系来帮助推广模型,而不是预测精确的值。研究人员分享说,他们的直觉是,来自不同分析的化合物将具有可比性,这使他们采用了在单个模型中结合成对元学习和成对学习方法的新方法。

ActFound使用六个真实世界的生物活性数据集进行了评估,并证明在同一领域和不同领域内比其他九种模型更有效。这突出了它不仅能够预测它所训练的数据的生物活性,而且还能很好地处理新类型的数据。

该模型还在一个预测癌症药物生物活性的案例研究中进行了测试,研究人员报告说,它比其他模型表现得更好。

打开网易新闻 查看精彩图片

ActFound的开发标志着在使用先进技术进行药物开发和发现方面迈出了重要的一步。人工智能和机器学习一直处于药物发现研究和开发的前沿。它们正在为新的突破铺平道路,并加速发现过程。