在药物研发、精细化工及新材料等配方优化场景中,“如何用最少的实验次数找到最优解”始终是研发人员的核心诉求。长期以来,实验设计(DOE)是行业的主流选择,但随着AI技术的发展,贝叶斯优化(Bayesian Optimization, BO)正以其更高的实验效率和智能化体验,成为研发数字化的新宠。

一、DOE:预设蓝图 vs 贝叶斯优化:边走边看

在优化实验中,DOE和贝叶斯优化代表了两种截然不同的思维方式:

DOE(实验设计,Design of Experiment):传统DOE(如全因子设计、正交设计、响应面法RSM)采用预先结构化的实验方案,通过统计回归模型(线性/二次)拟合因素与响应关系,分析主效应、交互效应,最终找到较优区域。优点:模型可解释性强(p值、置信区间、主效应图),流程标准化,易满足GMP/GLP/NMPA/FDA等合规审计要求。缺点:实验次数与因素数呈指数增长(k因素2水平全因子需2^k次),对高维(≥6因素)、强非线性/黑箱系统拟合能力有限,常需补点,总体实验量较大。

贝叶斯优化(Bayesian Optimization,BO):BO基于概率代理模型(最常用高斯过程Gaussian Process)对未知目标函数建模,每完成一轮实验后立即更新后验分布,再通过采集函数(如EI、PI、UCB)智能选择下一个最具信息增益的实验点,在探索(未知区域)利用(已知较好区域)之间取得平衡,逐步逼近全局最优。优点:自适应迭代、无需预设实验总数,在高维、非凸、非线性、黑箱场景下实验次数通常远少于DOE(常见节省30%–60%,极端可达90%)。特别适合配方优化中常见的痛点:多原料比例+多工艺参数(pH、温度、时间、流速等)、响应复杂协同/拮抗、单次实验耗时耗材。缺点:模型可解释性较弱(更偏向“给出最优推荐+置信度”,而非清晰的效应分解),早期合规落地需额外验证流程可追溯性。

二、贝叶斯优化是趋势

前沿探索性研发,本质就是与“高维黑箱”博弈的过程。在绝大多数现代配方/工艺优化场景(尤其是生物制药、抗体纯化、新材料、食品配方等领域),贝叶斯优化更值得推荐,因为它直接解决“实验最贵”的核心痛点——用最少实验找到最优解。低维、强监管、需详细机理分析时可仍选DOE,或采用DOE先筛关键因素 → BO精细优化的组合策略。这已成为工业界主流趋势。

打开网易新闻 查看精彩图片

三、鹰谷InAI:让贝叶斯优化像聊天一样简单

尽管优势明显,标准贝叶斯优化的应用门槛却很高。科学家需要理解高斯过程、采集函数(如EI, UCB)、超参数调整等复杂概念,并借助Python编程或专业软件进行操作,这让许多实验科学家望而却步——听过,但不会用,不敢用。

鹰谷信息(Integle)的科研AI大模型InAI,彻底颠覆了这一局面。它将先进的贝叶斯优化引擎与自然语言对话能力深度融合,带来了革命性的体验:

特色(1):对话式交互,小白也能轻松上手

标准BO操作:如Python bayesian optimization、GPyOpt、BoTorch等,需要编写代码或配置复杂软件界面、定义目标函数、变量范围、选择代理模型/采集函数、写迭代循环、手动记录每次实验结果、自己判断收敛。

鹰谷InAI BO操作:您只需要像与同事讨论一样,用自然语言描述您的优化目标。例如,直接输入:“我想优化一个催化剂的合成配方,目标是产物收率最大化,相关因素有反应温度(80-150℃)、压力(1-5MPa)、催化剂用量(1-5mol%),目前已有3组历史实验数据。”AI会自动理解您的意图,引导您确认优化目标和约束条件,并调用内置的贝叶斯优化引擎开始工作。无需任何数学和编程背景,就能用出专家水平。

特色(2):与研发数据流无缝集成
鹰谷InAI并非孤立工具,它植根于鹰谷SIMS科研智能管理平台。这意味着:

数据自动获取:优化可直接关联InELN(电子实验记录本)中的历史实验数据或实时实验结果。

知识增强:结合鹰谷自研的知识图谱和DeepSeek大模型,AI的推荐不仅基于数学模型,还能融入公开文献和专利中的化学、生物领域知识,使建议更具科学合理性。

闭环落地:优化推荐的实验方案可直接生成ELN实验记录模板,完成后数据自动回传,形成“设计-执行-学习-再优化”的智能闭环。

参考资料:

[1] 减少实验次数!鹰谷贝叶斯优化智能体:小白都能用,告别学了就忘.

https://mp.weixin.qq.com/s/v3qrM5GFxJF_zr298bYEVA

[2] . 鹰谷贝叶斯优化接入DeepSeek,小白都能用!

https://mp.weixin.qq.com/s/wtZ0NNHDlWWPIwzTo2OPFg

[3] 盘点:药物研发中最好用的16款电子实验记录本ELN.

https://mp.weixin.qq.com/s/5g6p7rFRSpMLHJZtfdVl5A

[4] 国家药监局药审中心关于发布《药物临床试验中应用贝叶斯外部信息借用方法的指导原则(试行)》的通告(2026年第6号). NMPA CDE. 2026.1.22.

https://www.cde.org.cn/main/news/viewInfoCommon/1b87c172f248c6eb876ea2b9d93c4d1e

[5] 从实验室到病床,贝叶斯方法打通最后一公里,患者还要等多久?

https://www.sohu.com/a/976920426_122575034

[6] FDA最新草案:监管松绑,医药开发或迎来“小样本、快审批”时代_贝叶斯优化. 2026.

https://news.qq.com/rain/a/20260114A05YI300

[7] 谁是国内电子实验记录本老大?

https://mp.weixin.qq.com/s/ZRpo23nK8QhrsK_-JbKxEA

[8] 《CIAPH2024-2025年度医药健康行业数字化调研报告》.

http://www.ileader.com.cn/html/2025/3/3/72409.htm

[9]《CIAPH2023-2024年度医药健康行业数字化调研报告》.

http://www.ileader.com.cn/html/2024/2/2/72345.htm

[10] Kruschke, J. K. & Liddell, T. M. Bayesian data analysis for newcomers. Psychon. Bull. Rev. 25, 155–177 (2017).

https://pubmed.ncbi.nlm.nih.gov/28405907/

[11]Eric Brochu. Interactive Bayesian optimization : learning user preferences for graphics and animation. University of British Columbia Library.PhD Thesis/Dissertation. 2011.

https://open.library.ubc.ca/soa/cIRcle/collections/ubctheses/24/items/1.0051462

[12] Johannes P. Durholt and et al. BoFire: Bayesian Optimization Framework Intended for Real Experiments. J.Mac. Lea. Res. 26 (2025) 1-7.

https://jmlr.org/papers/volume26/24-1540/24-1540.pdf

[13] Ma Y and et al. Preference-Aware Bayesian Optimization for Interactive Decision Making. IEEE Trans Cybern. 2025.

https://pubmed.ncbi.nlm.nih.gov/41289113/

[14] Martins CA Jrand et al. Bayesian Optimization for High-Dimensional Coarse-Grained Model Parameterization: A Case Study on Pebax Polymer. J Chem Theory Comput. 2026.

https://pubmed.ncbi.nlm.nih.gov/41563327/

[15] Huddy JE and et al. Spatial-Uniformity-Driven Bayesian Optimization for Rapid Development of Printed Perovskite Solar Cells. Small. 2026.

https://pubmed.ncbi.nlm.nih.gov/41293995/

[16] Siska M, Pajak E, Rosenthal K, Del Rio Chanona A, von Lieres E, Helleckes LM. A Guide to Bayesian Optimization in Bioprocess Engineering. Biotechnol Bioeng. 2026.

https://pubmed.ncbi.nlm.nih.gov/41504386/

[17] Fumina A and et al. Bayesian Optimization of Colloidal Monolayer Formation in Langmuir-Blodgett System. Langmuir. 2025.

https://pubmed.ncbi.nlm.nih.gov/41059978/

[18] Zhuo H and et al. Gaussian Process-Based Multi-Fidelity Bayesian Optimization for Optimal Calibration Point Selection. Sensors (Basel). 2025.

https://pubmed.ncbi.nlm.nih.gov/41305237/

[19] Stephen J. Ruberg et al. Application of Bayesian approaches in drug development: starting a virtuous cycle | Nature Reviews Drug Discovery. 2023.

https://www.nature.com/articles/s41573-023-00638-0

[20] FDA Issues Guidance on Modernizing Statistical Methods for Clinical Trials. 2026.1.12.

https://www.fda.gov/news-events/press-announcements/fda-issues-guidance-modernizing-statistical-methods-clinical-trials

[21]Use of Bayesian Methodology in Clinical Trials of Drug and Biological Products. FDA. 2026.1.12

https://www.fda.gov/regulatory-information/search-fda-guidance-documents/use-bayesian-methodology-clinical-trials-drug-and-biological-products

[22]Asif Khan and et al. Toward real-world automated antibody design with combinatorial Bayesian optimization.Cell Reports Methods,Volume 3, Issue 1,2023.

https://doi.org/10.1016/j.crmeth.2022.100374.

[23]Introduction to Bayesian optimization.

https://livebook.manning.com/book/bayesian-optimization-in-action/chapter-1