2025全球AI驱动药物发现(AIDD)年度深度报告

——来自BioPharmaTrend的全景综述

目录

  • 新框架综述

  • AI 药物发现的“整体主义”

  • AI药物发现本质是软件平台建设

  • 数据为王:AI驱动下的数据基础

  • 验证——AI药物平台价值的试金石

  • 2025年后的AI药物大愿景

  • 主要图表与数据

  • 参考与声明


一、引言:AI药物发现的新框架

随着AI在制药和生物技术领域的应用不断加深,人工智能驱动的药物发现(Artificial Intelligence-Driven Drug Discovery, AIDD)公司这一新兴类别尚未形成公认的定义。本文提出了一套定性框架,综合了四项关键属性以甄别头部AIDD企业:

  1. 关注整体主义 vs 还原主义的生物建模
  2. 构建强大且可扩展的AI软件平台
  3. 高度重视数据采集与整合
  4. 平台技术验证(新靶点发现、临床候选药物开发速度、合作、论文、专利等)

AIDD平台的核心商业价值,归结为三个核心问题的肯定答复:

  • 其计算平台能否大规模影响R&D工作流、跨专业协作和决策,提高整体研发效率?

  • 能否在计算机系统中足够深度与广度地表达生物学本质,洞察复杂依赖/网络效应,对科研决策产生深远影响?

  • 是否能在整个组织、甚至第三方持续、标准化地提供上述价值?

AIDD的业务资产正源于对这三问的“YES”答复。

二、“AI药物发现”中的整体主义(Holism)与还原主义

传统计算药物发现(CADD)

  • 线性或非线性的QSAR建模、虚拟筛选、对接等,主要开展于人工设计的分子描述符、统计学模型、假设驱动的精细任务(如靶蛋白对接、类药分筛).

AI驱动的新范式

  • 转向系统生物学层面,深度学习系统整合多模态数据,如表型组学、基因组、患者数据、化学结构、文本、图像等,构建庞大知识图谱,追求假设无关的整体建模。

举例分析:

Insilico Medicine - Pharma.AI平台

  • 核心基于强化学习(policy-gradient)与生成模型结合,兼顾效价、毒性、新颖性等多目标优化;

  • PandaOmics模块集成了超1.9万亿数据点,涵盖千万样本RNA-Seq/蛋白组、大量文献、专利/临床记录等,通过NLP和机器学习挖掘并优先级排序新靶点

  • Chemistry42使用GANs和Reinforcement Learning等深度生成方法,自动设计结构新颖的候选分子,优化结合力、代谢稳定性等。

Recursion OS 平台

  • 汇聚65 PB(千万亿级字节)专有生物数据,全球高速实验室(BioHive-2)驱动;

  • Phenom-2模型基于8亿张细胞显微图片的大规模视觉变换器,提升遗传干预分辨率60%;

  • MolPhenix、MolGPS等分子-表型整数模型全面领先;

  • 内置知识图谱做靶点解卷(deconvolution),结合蛋白结构、文献、专利与临床等,深入分析疾病网络与革新点。

Iambic Therapeutics

  • 以Magnet (反应感知生成新分子)、NeuralPLexer(原子级扩散结构生成)、Enchant(多模态PK预测)三大AI模块为一体,自动完成设计-结构评估-临床特性推断,实现分子的全流程端到端优化。

Verge Genomics - CONVERGE®平台

  • 针对神经退行类疾病,整合超60TB真实人类基因表达/大规模扰动/蛋白互作/病人样本等多模态数据,机器学习助力靶点筛选并全链路内部验证,加速ALS等药物管线推进。

三、生成式AI:驱动药物创新
  • 2016年Insilico Medicine率先将GANs(生成对抗网络)引入分子生成;

  • 2017年Transformer(“Attention is all you need”)、BERT、GPT等使长距离序列依赖捕获和生成式建模得到质的飞跃。

  • Transformer、LLM等大模型极大拓展了蛋白结构、药物化学、自动化实验的边界,如今药物生成、模块自动优化、全流程端到端的“产业级”能力成为可能。

表1 传统CADD与现代AIDD对比

维度

传统Chemi/BioInformatics

AI药物发现AIDD

主要聚焦

QSAR、结构设计、库筛

自动生成、端到端优化、新假设生成

技术核心

人工描述符、线性/非线性模型、对接等

深度学习、生成模型、Transformer、主动学习等

特征工程

手工特征提取、分子指纹

自动特征抽取、发现隐性模式

数据源

小型已知数据库

海量多模态数据、真实世界证据、合成数据

生成能力

规则枚举、库搜索

AI驱动de novo分子生成,挖掘全新化学空间

可扩展性

受限于计算与库大小

云原生高通量,处理亿级组/分子

人工参与度

高人工干预

自动化建议、决策,极大减少人力干预

集成模式

单点工具

端到端平台,实时反馈,自动循环优化

洞察范畴

局部聚焦、结构类比

深度挖掘复杂生物-化学-表型数据集模式

价值主张

已知靶点/系列,成功率高

新靶点/新化学、R&D提效突破、全新诊断/药物

四、AIDD本质也是软件平台的战争

顶级AIDD公司的“硬核”并非只是AI模型,而是工程化的软件系统:

  • 清晰的用户界面(GUI)和API支持,模型选择、超参数调优、可视化评估全流程可控;

  • 标准化数据管道对接结构、组学、临床数据,后端模块支持主动学习/强化学习、数据治理、审计追踪、安全加密等;

  • 云原生/私有化多部署方式可选,可被第三方客户以许可或SaaS方式直接集成到内部研发。

如果无法证明其软件产品的可用性、规模化与可验证性,AIDD创新就难以落地为生产力。

行业现状点评:
现阶段绝大多数“AI制药公司”仍无法公开展示成熟软件平台,Insilico、Schrodinger、OWKIN、Iktos、CytoReason、BenchSci、Recursion等是为数不多真正具备工程化SaaS能力的案例。

五、数据为王:AI落地的基础

AI制药浪潮下,“数据基础”成为驱动创新的核心资产。

  • Insilico Medicine

    :2022年在中国苏州建设全球第六代AI+智能机器人药物研发工厂,自动细胞培养、高通量筛选、NGS、高内涵显微成像六大模块环环相扣,形成DNA-RNA-蛋白-表型-文献的全流程闭环,自动化验证+反哺AI模型.

  • Recursion

    :自有65PB多组学数据,每周220万高通量实验(CRISPR Cas9 + Brightfield imaging),集成20PB患者外部数据,独造“Neuromap”神经科学全景图谱,与Roche/Genentech联动40条研发管线.

  • CytoReason

    :融合公开与私有海量组学、蛋白学与临床数据,Disease Model Platform AI精确分析疾病-治疗-患者多级关联.

  • BPGbio(前Berg Health)

    :10万+临床样本、全谱组学(基因组、蛋白、代谢、脂质),NAi系统预测生物标志物与新靶点,持续早期临床推进.

  • NOETIK

    :高质量实体肿瘤样本库,空间转录/蛋白组、全外显子测序、严控时间与质量,赋能自监督OCTO AI建模肿瘤微环境与疗效预测.

六、AI平台验证——赢得信任的关键

AIDD价值的最大保证在于“可验证性”:

  1. 内部驱动新药从靶点发现-分子设计-优化-转入临床,时间、数量、成功率是否突破行业平均;

  2. 对外与制药巨头合作,由第三方数据检验平台有效性,实现付费/许可业务;

  3. 高水平论文、专利、公开演示与行业标杆案列发布;

  4. 持续输出被认同的临床前/临床项目(参见下表)。

主要AI制药公司管线发展动态

公司

管线推进代表项目

进展(2019-2025抽样)

BenevolentAI

IBD/肿瘤/心肾等

BEN-8744/28010/34712等,多进临床创新

Healx

罕见病/肌萎缩/代谢病

HLX系列,逐步推进至II期

Insilico

肺纤维化/慢性肾病/BRC等

INS018_055等,10条管线获IND

Recursion/Exscientia

神经纤/肿瘤/炎症

REC-2282/4881/994/617等,齐头并进

Schrodinger

恶性淋巴瘤/实体瘤等

SGR-1505/2921/3515/5等,逐渐从临前转临床

Verge/Valo

ALS/肥胖/神经退化病

VRG50635/201/OPL系列等

Relay Therapeutics

胆管癌/乳腺癌等

RLY-4008/2608/1013等,数条项目冲刺

七、药物开发速度与经济性:AI真的加速了吗?

公司

平均发现周期

单程序筛选分子数

Insilico Medicine

12-18月(22条管线)

60-200

Recursion

18月(REC-1245等)

<200

Exscientia

11-18月(EXS4318等)

150-250

Iambic

8月(IAM1363)

传统方法

40-50月

3000-5000

相比行业普遍2.5-4年,AI驱动公司已实现12-18月快速完成靶点-分子-IND推进。但“快”仍需看后续临床数据“有效”,目前AI挑选化合物平均筛选数量远低于传统方法,能否保证药物的效果和安全性依然值得行业警惕。

唯一可见经济性增强证据,Insilico称某些项目仅用传统成本1/10完成——但这一点未经严格独立第三方验证。

八、AIDD行业2025愿景:向“整体药物开发”(Holistic Drug Development, HDD)前进

本文观点强调:AIDD的终极目标不是把机器学习赋能到现有结构基础药物研发流程就算完事,而是彻底换道重构——通过全景模型理解患者与疾病、数据反推分子假说、自动化研发环,步步回溯最终走向“整体药物开发(HDD)”。其难点在于数据底层逻辑与全链路闭环优化,需要重塑传统分工和知识表达体系。但首批突破已经在路上,未来值得期待。

九、专业建议与结语

  • 不要只看管线数量或论文,重点关注企业AI系统是否提升了决策效能与流程速率;

  • 积极评估外部合作伙伴对AI平台的真实反馈,如软件授权及里程碑达成情况;

  • 严格分析投资背后AI的“真正贡献”,避免被表象(如融资、团队或合作数量)所误导;

  • “整体药物开发”是AIDD的终极愿景,我们刚刚进入新纪元。

十、参考与声明

本文所有数据、图片、管线信息均整理自BioPharmaTrend公开材料与部分企业交流,具体引用详见文末引用标记

BioPharmaTrend战略咨询 部分内容参考2025年5月公开资料

Sources:https://www.biopharmatrend.com/ai-drug-discovery-pipeline-2024/

识别微信二维码,可添加药时空小编

请注明:姓名+研究方向!