编辑丨王多鱼

排版丨水成文

在几乎所有传染病、免疫性疾病和癌症的治疗中,T细胞受体(T-cell receptor,TCR)都发挥着重要作用。但和抗体类似,T细胞受体也有着极高的多样性,和各种疾病抗原(antigens)相互作用的规则至今不明。

如何生成一个可以预测T细胞受体与抗原交互的计算模型,一直是像蛋白质结构预测(AlphaFold)一样悬而未决的重大问题。在过去几年里,尽管各种文献和算法(NetTCR、DeepTCR、AITCR等)不断为突破这一问题付出努力,但都局限在预测人类已知的几十个抗原的T细胞受体。

近日,硅谷生物技术初创公司Vcreate在bioRxiv平台发布了一项题为 :TAPIR: a T-cell receptor language model for predicting rare and novel targets 的最新研究成果, 让人工智能 (AI) 模型预测稀有免疫治疗新靶点有了新的突破 。

Vcreate的科学家团队开发出一种名为TAPIR(T-cell receptor and Peptide Interaction Recognizer)的深度学习模型,用于预测T细胞受体(TCR)与各种稀有或未知肿瘤相关抗原的交互作用。

相较于已有模型,TAPIR无论是预测能力还是运算效率都有显著的提高。这得益于研究团队使用了以下三种手段来提高TAPIR的预测能力:

1)整合大量不同来源的训练数据,包括自己的高质量内部数据,涵盖了近千个常见和稀有抗原;

2)使用两个卷积神经网络 (CNN) 分别编码T细胞受体和抗原,不再限制抗原系列;

3)使用已知实验数据生成大量不完整的合成数据 (bootstrap) ,使模型能够处理不完整的T细胞受体序列。

TAPIR的诞生,为发现新型免疫治疗药物提供了有力支撑。上线后短短30天内,就有来自世界各地超过四十家生物技术企业和科研院所院校开始注册使用TPAIR。

现在,登录并注册Vcreate的公共服务器https://vcreate.io/tapir,世界各地的研究人员都可以免费使用TAPIR模型提高运算速度,同时为大量可能的治疗备选受体进行排序和优化,推进该领域的探索。

在这篇最新发表的论文中,Vcreate的科学家团队Binbin ChenManjima DharEthan Fast用多年积累的数据集,重新训练了三种最常见的已知预测方法(NetTCR、DeepTCR和AITCR),并对预测结果进行了比较。无论是常见抗原还是稀有抗原,TAPIR模型的预测结果都优于常用的三个机器学习。

此外,他们还使用TAPIR模型产生新的抗流感T细胞受体序列(generative model)。结果表明,TARPIR生成的六个T细胞受体序列中,有两个能够准确识别流感抗原序列。

图1. TAPIR预测T细胞和抗原相互作用的运行原理和5种应用前景

令人振奋的是,该研究还使用TAPIR模型分析了乳腺癌病人的T细胞单细胞数据,发现并验证了一个能够准确攻击常见乳腺癌的癌变(PIK3CA)的T细胞受体——C-30。通过实验验证发现,C-30受体使正常T细胞攻击携带乳腺癌癌变的细胞,但不攻击未癌变的版本。这一令人激动的结果预示着,在不久的将来,像TAPIR这样人工智能的免疫工程平台将为治愈肿瘤、免疫系统疾病和传染病等人类顽疾带来新的曙光。

作者简介

陈滨滨(Binbin Chen),斯坦福大学医学院MD/Ph.D,Vcreate创始人、CEO。陈博士专注于免疫学领域的研究,目前已在 Nature、Nature Biotechnology 等顶级学术期刊发表论文二十余篇。2021年,他和斯坦福大学计算机系校友共同创立了Vcreate,并集结了全球范围内的顶尖科学家团队,共同探索应用机器学习等前沿技术,预测T细胞受体、寻找稀有靶点,为肿瘤、免疫系统疾病和传染病等人类顽疾寻找治愈之道。

目前,Vcreate已加入斯坦福大学Start X创新网络,并与全球制药巨头阿斯利康建立合作。此外,Vcreate还获得了医药企业默克的投资。2023年10月,Vcreate科学家团队最新研究成果深度学习模型TAPIR上线,为世界各地的研究人员预测T细胞受体与各种稀有或未知肿瘤相关抗原交互作用提供了全新的解决方案。

论文链接

https://doi.org/10.1101/2023.09.12.557285

可注册并试用TAPIR模型:https://vcreate.io/tapir