在生物医药领域,单克隆抗体凭借其高特异性和良好的安全性,长期占据着全球治疗药物市场的核心地位。然而,传统的抗体发现流程——无论是依赖动物免疫的杂交瘤技术,还是基于库筛选的噬菌体展示技术——本质上都是一种基于随机碰撞的“筛选”模式。
近年来,生成式人工智能(Generative AI)的跨代式演进正在彻底重塑这一格局。从基于扩散模型(Diffusion Model)的结构生成,到基于蛋白质语言模型(pLM)的序列预测,AI 已经能够跳过天然免疫系统的限制,实现抗体的“从头设计”(De novo Design)。这一转变意味着科学家不再是在已有的生物库中“大海捞针”,而是能够根据靶点的原子级物理化学特征进行“精密绘图”和“精准定制”。
本文旨在系统梳理当前全球范围内最前沿的 AI 抗体设计模型。这些模型既包括来自首尔大学、哈佛大学、华盛顿大学等顶级学府的学术突破(如 RFdiffusion、AntiFold),也涵盖了由 Xaira、Nabla Bio、Absci 等生物技术先锋公司开发的商业化平台。
通过对这些模型的技术架构、核心优势及临床应用成果的深度解析,我们得以窥见 AI 如何将抗体研发从“随机筛选”时代加速带入“数字化智造”时代。
01
GaluxDesign
公司
Galux (韩国)
简介
GaluxDesign 是由韩国生物技术公司Galux 开发的顶尖生成式 AI 抗体设计引擎。该模型的核心使命是实现真正的“从头设计”(de novo design),即在完全不参考现有抗体序列或已知抗体-抗体复合物结构的前提下,仅凭靶点蛋白的三维结构信息,就能在计算机虚拟空间内“画”出与之完美匹配的抗体分子。
AI抗体设计相关数据
该模型的技术根基源于首尔大学Seok Chaok 教授在蛋白质折叠与相互作用领域的长期积累。在传统研发中,针对某些“难成药”靶点(如IL-11 或特定的离子通道),由于缺乏天然存在的结合抗体,研究人员往往无从下手。而GaluxDesign 展现了极强的创新能力,它能够深入分析靶点表面的原子级物理化学特征,精确计算疏水性、电荷分布及氢键供体等参数,从而从零开始构建抗体。
在实际成果方面,Galux已通过该模型成功开发出针对PD-L1、HER2、EGFR、IL-11等 8个关键治疗靶点的先导抗体。这些由AI 设计的分子不仅在体外实验中表现出极高的亲和力,其中部分候选药物还通过了冷冻电镜(Cryo-EM)的结构验证。实验结果显示,抗体与靶点的实际结合方式与AI 预测的原子模型高度一致,这证明了GaluxDesign 在处理蛋白质动态交互方面具有极高的可靠性,将抗体研发从“随机筛选”时代带入了“精准定制”时代。
特色
•原子级精度预测:模型不仅生成抗体的氨基酸序列,还能以原子级别的分辨率预测其三维构象。这种精度允许研究人员在合成前就精准评估结合能(Binding Energy)和特异性。
•攻克“无参照”靶点:即使针对从未有抗体复合物结构的全新靶点(如细胞因子 IL-11),模型也能凭借底层的物理化学法则进行预测,极大地拓宽了抗体药物的覆盖范围。
•结构驱动的验证:与多数仅预测序列的语言模型不同,GaluxDesign 强调结构逻辑。它能有效识别靶点上极小的突变(甚至单个氨基酸的变化),从而设计出能够区分野生型和突变型蛋白的高度特异性抗体。
•端到端流程:结合高效的能量函数计算与生成算法,模型能快速生成数千个候选分子,并通过内部算法剔除掉那些虽然结合力强但稳定性差(易聚集、溶解度低)的分子,确保设计的抗体具备良好的可生产性。
网址:https://galux.co.kr/
02
JAM (Joint Atomic Modeling)
公司
Nabla Bio
简介
JAM (Joint Atomic Modeling) 是由哈佛大学 Church 实验室孵化的Nabla Bio 公司所研发的核心 AI 引擎。作为一种新一代的多模态基础模型,JAM的核心逻辑是将抗体设计视作一种极高维度的“语言生成”与“几何构建”的统一体。在生物制药领域,寻找理想抗体的过程往往被比作在浩如烟海的分子库中捞针,而JAM 则利用深度学习技术,将这一过程转变为精准的“定向导航”。
该模型不仅学习了数亿条蛋白质的序列信息,还深度集成了高分辨率的蛋白质三维结构数据。这种“序列+结构”的双重训练,使JAM 具备了类似于大型语言模型(如GPT)的逻辑外推能力。当研究人员输入一个特定靶点(如极难成药的GPCR 蛋白)的结构信息时,JAM能够像在搜索引擎中自动补全残缺句子一样,自动生成并补全能够与之精准互补的抗体关键结合区域(CDR区)。
根据Nabla Bio 披露的测试数据,在针对极具挑战性的多跨膜蛋白靶点时,JAM 设计的100 种抗体中,通常有 1到10 种能够精准命中目标并表现出极强的结合亲和力。这一成功率(10%左右)相较于传统高通量筛选(往往低于0.1%)提升了数十倍甚至数百倍。更重要的是,JAM在生成序列时会同步优化分子的物理化学属性,确保生成的抗体不仅“粘得牢”,而且“身体壮”——具备良好的热稳定性和溶解度,从而极大地降低了后续工业化生产的失败风险。
特色
•多模态融合架构: JAM 并不孤立地看待氨基酸序列,而是将原子级别的空间几何位置与进化序列信息深度耦合。这种“联合原子建模”使其能预测复杂的原子间作用力,确保生成的抗体在真实物理世界中具有稳定性。
•语义化的“自动补全”设计:模型将抗体设计模拟成一种条件概率填充。给定靶点的结构“上下文”,JAM能够预测出最符合能量最低原理且最具结合潜力的抗体氨基酸排列方式。
•攻克“难成药”靶点:针对如 GPCRs(G蛋白偶联受体)和离子通道等传统方法难以攻克的靶点,JAM能够识别细微的结合口袋,绕过天然免疫系统的局限性,设计出自然界不存在的高性能分子。
•端到端的性能预测:除了设计结合能力外,该模型还能在生成阶段同步评估抗体的“可成药性”(Developability),包括避免聚集、减少免疫原性等关键指标,显著缩短了从实验室发现到临床申报的周期。
网址:https://www.nabla.bio/
03
Zero-shot Generative AI
Absci
简介
Absci研发的Zero-shot 生成式 AI 模型代表了抗体发现领域的一项突破性范式转移。在传统的药物研发中,AI模型通常需要依赖大量的“已知对”数据(即已知的特定靶点及其对应结合抗体的数据)进行学习。
然而,Absci的“零样本”(Zero-shot)技术打破了这一限制:它能够在没有任何已知结合物数据的情况下,仅凭靶点的结构信息,直接生成具备功能性的全新抗体序列。
Absci官方抗体设计原理示意图
这一能力对于处理那些人类从未攻克过、或缺乏历史研究数据的“孤儿靶点”和新发传染病具有至关重要的意义。Absci的模型通过对蛋白质语言深度逻辑的理解,能够识别出靶点上最脆弱、最具治疗潜力的结合表位,并精准地构建出与之匹配的抗体架构。在实际验证中,该模型在设计针对HER2(乳腺癌关键靶点)等已知靶点的抗体时,展现出了令人惊叹的创造力——它生成的抗体序列不仅与现有药物(如曲妥珠单抗)完全不同,甚至超出了人类天然免疫系统所能产生的序列空间,这极大地降低了药物专利冲突的风险。
更具竞争力的是,Absci将这一AI 模型深度集成到了其Integrated Drug Creation 平台中。该平台不仅仅是一个虚拟计算中心,更是一个庞大的生物实验室系统。通过其专利的SoluPro大肠杆菌表达系统,AI 设计出的数百万种抗体方案可以在短短一周内被转化为真实的蛋白质,并在实验室中进行实测。这种“干(AI)设计”与“湿(实验室)验证”的闭环迭代,使得模型能够根据真实的实验反馈迅速进化,将传统需要数年才能完成的药物发现流程缩短至几个月。
特色
•“零样本”生成能力:核心优势在于无需针对特定靶点的历史结合数据。模型通过学习数以亿计的通用蛋白质折叠规律,掌握了结合界面的“普适密码”,从而实现对全新靶点的“首发即命中”。
•湿实验闭环验证:与纯计算公司不同,Absci 拥有强大的高通量蛋白质合成与筛选平台。每周数百万次的实验数据会源源不断地反馈给AI,通过这种“主动学习”(Active Learning)机制,极大地提高了设计的成功率。
•可成药性一体化设计:该模型在生成抗体时,会同时考虑亲和力、溶解度、热稳定性以及表达量等多个维度。这意味着设计出的抗体不仅能治病,而且易于大规模工业生产。
•突破专利边界:由于模型生成的序列具有高度的原创性,它能帮助药企避开已有的序列专利陷阱,在竞争激烈的抗体药物市场中开辟全新的技术路线。
网址:https://www.absci.com/
04
EVA
LabGenius (英国)
简介
LabGenius是一家总部位于伦敦的药物研发先锋,其核心平台EVA™是一个高度自动化的抗体发现与优化引擎。在传统抗体研发中,科学家往往需要在多个性能指标(如亲和力、特异性、稳定性和可生产性)之间进行权衡,这种“顾此失彼”的局限性常导致药物在临床阶段因脱靶毒性而失败。EVA™的出现彻底改变了这一现状。
该平台的核心优势在于其端到端的闭环迭代系统。不同于纯粹的计算机模拟,EVA
将生成式AI 与先进的机器人自动化、合成生物学紧密结合。在每一轮研发循环中,AI模型会根据上一轮的实验数据,在广阔的蛋白质设计空间中自主生成数千个多特异性抗体方案。随后,这些设计会被输送至机器人实验室进行自动化合成与功能测试,实验产生的真实世界数据再反馈回模型中进行训练。
LabGenius 的技术核心在于“主动学习(Active Learning)”驱动的实验闭环
目前,LabGenius正利用EVA重点攻克肿瘤免疫疗法中的副作用难题。通过设计能够同时识别两个或多个肿瘤相关抗原的多特异性抗体(Multispecific Antibodies),该平台能够像“电子锁”一样,只有在探测到肿瘤细胞特有的多个特征组合时才激活免疫攻击。这种逻辑显著提升了药物的定位精度,有效避免了对携带单一靶点的健康组织的攻击。其开发的 T细胞衔接器(TCE)资产已展现出卓越的选择性,有望在2026 年为癌症患者带来更安全的治疗选择。
特色
•多目标协同优化(Multi-Objective Optimization):采用贝叶斯优化算法,能够同时针对亲和力、溶解度和肿瘤杀伤选择性等10 多个关键指标进行同步迭代,确保选出的分子在所有维度上都是最优的。
•极速闭环迭代:“设计-构建-测试-学习(DBTL)”循环周期仅为 6 周。通常经过 4轮循环(约24 周),模型就能从数百万个潜在变体中锁定最佳候选药物。
•多特异性抗体工程:专注于设计具备“密度门控亲和力”(Density-gated avidity)的复杂抗体,使其能精准区分高表达癌细胞和低表达正常细胞。
05
Chroma
公司
Generate:Biomedicines (美国)
简介
Chroma是由Generate:Biomedicines 开发的生成式蛋白质设计模型。它被形象地誉为蛋白质领域的“DALL-E”,能够根据特定的生物物理特征、对称性甚至自然语言描述,直接在计算机中生成全新的蛋白质和抗体结构。在传统研发中,优化现有抗体(如针对哮喘的替泽普单抗)往往需要经历数轮繁琐的湿实验筛选,而Chroma 则通过深度学习技术,直接在设计空间内进行多维度的分子“微调”。
以GB0895 资产为例,Chroma 并不只是简单地提高抗体对靶点TSLP 的亲和力,它还同步优化了抗体的半衰期。通过对抗体恒定区与可变区的协同建模,AI能够预测并改进分子在人体内的代谢动力学特性。
结果显示,经过Chroma 优化的 GB0895 能够使给药周期从每月一次大幅延长至每半年一次。这种“长效化”的突破不仅提升了患者的用药便利性,也标志着AI 能够从底层逻辑上重构已知药物的性能。目前,该项目已成功进入 I期临床试验,证明了Chroma 设计的分子在真实人体环境中的有效性与安全性。
特色
•扩散模型架构(Diffusion Model):借鉴了图像生成领域的扩散算法,通过从“随机噪声”中还原出符合物理法则的蛋白质原子坐标,实现从头设计。
•多性能协同优化:能够在设计初期就将亲和力、溶解度、热稳定性和半衰期等多个指标整合进生成逻辑,避免了后期反复修补。
•语言驱动设计:模型支持通过自然语言指令(如“设计一个高亲和力且性质稳定的 TSLP 结合蛋白”)来引导生成过程。
网址:https://generatebiomedicines.com/
06
RFantibody & RFdiffusion
Xaira Therapeutics (美国)
简介
Xaira Therapeutics 是目前 AI 药物开发领域融资规模最大(超过10 亿美元)的初创企业。其核心技术由诺贝尔奖得主David Baker 教授的实验室孵化,主要依赖于 RFantibody 和RFdiffusion 等一系列具有划时代意义的蛋白质设计算法。
Xaira的核心方法论被称为“协同进化”(Co-evolution)驱动的闭环设计。在该方法下,AI模型不再是静态的工具,而是一个动态进化的生态系统。在研发初期,模型生成初版候选药物;随后,公司的大规模自动化平台会生成海量的湿实验数据,这些数据不仅包含“哪些分子结合了”,更包含“哪些分子没结合”及其背后的物理原因。这些真实世界数据会不断反哺给AI 模型。
模型原理示意图
随着迭代次数的增加,AI模型对特定生物物理空间的理解呈指数级提升。这意味着,到了研发的中后期,模型生成的前几个候选药物往往就已经是最终答案,所需的实验迭代次数从传统的数十次锐减至个位数。这种“越用越聪明、研发越快”的正向循环,极大地缩短了药物从概念到先导化合物的挖掘时间。
特色
•基础模型驱动:基于 David Baker 的 RosettraFold 架构,具备全球领先的蛋白质骨架与序列预测精度。
•端到端应用: AI 贯穿从生物学靶点发现、分子设计到临床方案优化的全生命周期。
•超大规模实验回传:通过 FiCS Perturb-seq 等技术,产生高质量的单细胞级功能数据,作为模型进化的“养料”。
网址:https://www.xaira.com/
07
ESM-3
公司
EvolutionaryScale (由前Meta AI核心成员创建)
简介
ESM-3是目前全球参数量最大、能力最强的多模态蛋白质基础模型(最大版本达980 亿参数)。它将蛋白质的序列(Sequence)、结构 (Structure) 和功能 (Function) 统一为一种离散的“生物语言”。它不再仅仅是一个预测工具,而是一个具备“编程生物学”能力的生成引擎。
evolutionaryscale设计蛋白原理示意图
ESM-3最大的突破在于它模拟了地球 5亿年的进化逻辑。用户可以通过组合各种提示(Prompts)来引导模型。例如,你可以给它一个催化活性中心的坐标(结构提示),加上某种酶的关键词(功能提示),再给它一段残缺序列(序列提示),它能像ChatGPT 补全句子一样,自动生成一个全新的、在自然界中从未存在过且具备生物活性的蛋白。它最著名的成果是设计出了一种与天然绿色荧光蛋白(GFP) 序列相似度极低但具备发光功能的新蛋白 esmGFP。
特色
多模态联想能力。它是第一个能同时理解氨基酸排列、三维原子坐标和抽象功能标签的模型。
网址:https://www.evolutionaryscale.ai/
08
Chai-1/Chai-2
Chai Discovery (顶级硅谷AI药研初创公司)
简介
Chai-1是一款全原子分子结构预测模型,其性能在多个指标上超越了AlphaFold3。它的特色在于对蛋白质-配体(Protein-Ligand)、蛋白质-核酸以及复杂多聚体相互作用的精准捕捉,且支持无MSA (多序列比对) 模式,极大提升了对罕见序列的预测速度。
Chai设计抗体原理示意图
Chai-2则是在Chai-1 基础上的进阶版,专注于全从头(fully de novo)抗体设计。Chai-2实现了惊人的突破:在针对52 个从未有已知结合物的挑战性靶点时,其设计的抗体在实验室实测中达到了16%-20% 的命中率,这比传统计算方法提高了 100 倍以上。这意味着研究人员可以跳过耗时数月的高通量筛选,直接在24 孔板中验证少量AI 设计的分子。
特色
极致的原子级精度和“零样本”抗体生成能力,特别擅长处理涉及配体和翻译后修饰的复杂场景。
网址:https://www.chaidiscovery.com/
09
AntiFold
牛津大学蛋白质信息学小组(OPIG)
简介
AntiFold是一款专门针对抗体优化的逆折叠(Inverse Folding)模型。在抗体研发中,当我们通过 RFdiffusion 等模型得到了一个完美的骨架结构时,需要填入最合适的氨基酸序列。AntiFold正是为此而生:输入抗体的三维构象,它能输出哪些氨基酸序列最能维持该结构的稳定性。
AntiFold设计抗体原理示意图
AntiFold基于ESM-IF1 模型并针对抗体专有数据进行了精调。它能精准预测抗体关键结合区(CDRs) 的序列恢复率。它的核心价值在于“序列搜索与优化”,能帮助科学家在不改变抗体三维架构的前提下,通过微调氨基酸来提升抗体的亲和力、溶解度并降低免疫原性。
特色
抗体专用性极强。它能给每个残基位点打分,告诉设计者哪些位置可以突变以增强性能,哪些位置绝对不能动。
网址:https://opig.stats.ox.ac.uk/webapps/antifold/
10
MAGE
原理示意图
团队
范德堡大学医学中心 (Vanderbilt University Medical Center
简介
该模型由范德堡大学医学中心 (Vanderbilt University Medical Center, VUMC)Ivelin Georgiev教授团队开发,相关研究成果于 2025 年 11 月发表于国际顶级期刊Cell。
MAGE 是一种基于蛋白质语言模型 (PLM) 的端到端人类单克隆抗体生成框架。它是首个证明能够仅凭抗原序列(无需抗体模板或复杂的结构复合物信息)即可设计出具有实验验证活性的成对重/轻链抗体的 AI 模型。
MAGE 的底层架构源于对 Progen2(一种自回归解码器大语言模型)的深度微调。研究团队利用大规模抗体-抗原配对序列数据库,使模型学习到了抗原特征与抗体可变区序列之间的映射逻辑。与DiffAb 依赖三维坐标不同,MAGE 通过处理氨基酸序列的语义空间,实现了从抗原“提示词”到抗体“响应序列”的直接转换。
特色
无模板的从头生成 (Template-free Design):MAGE 突破了传统方法对初始抗体模板或 CDR 框架的依赖,能够直接针对目标抗原生成全新的、成对的人类抗体V_H和 V_L序列。
零样本学习能力 (Zero-shot Learning):模型展现出极强的泛化性能,能够针对训练数据中从未出现过的新型抗原(如 H5N1 禽流感病毒)设计出具有结合力的抗体,这对于应对突发流行病具有重要意义。
序列驱动的高通量特性:由于模型运行在序列维度而非高耗能的结构模拟维度,MAGE 在设计速度上具有显著优势,能够快速生成具有高度多样性的候选抗体库。
实验验证的有效性:在针对 SARS-CoV-2、RSV-A 和H5N1 的实测中,MAGE 生成的抗体表现出高达28%-45% 的结合成功率,部分抗体表现出纳克级的强中和效力。
新颖的生物学发现:冷冻电镜解析显示,MAGE 生成的抗体拥有不同于天然抗体的结合模式和新型 CDR 序列,拓宽了人类对抗体功能空间的认知。
识别微信二维码,添加生物制品圈小编,符合条件者即可加入
生物制品微信群!
请注明:姓名+研究方向!
本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(cbplib@163.com),我们将立即进行删除处理。所有文章仅代表作者观不本站。
热门跟贴