编者按
当 AI 正在重构科研与产业的底层逻辑,AI for Science 早已不是纸上概念。4月28日,未来光锥联合北京中关村学院AI商学院,共同推出「AI for Science 创变者说:学界 × 产业先锋对话系列沙龙」。首期活动邀请了3 位一线嘉宾。智源深澜创始人兼CEO王承志分享了团队在自动化蛋白质连续定向进化平台研发上的硬核实践和对AI4S现在和未来的思考。
AI正在改写科学研究的底层逻辑——从帮科学家分析数据的“辅助工具”,到能自主设计、执行、迭代实验的“科研智能体”,AI for Science的3.0时代,已经从概念走进现实。
AI4S的三个阶段:从“显微镜插件”到“自主科研智能体”
在王承志看来,AI4S的演进可分为三个阶段:
1.0阶段:辅助工具,AI只是科学家手里的“显微镜增强插件”,核心做实验数据后处理、湿实验分析,只帮复盘,不帮设计。
2.0阶段:导航式设计引擎,生成式AI入场后,AI从“后视镜”变成“导航仪”——实验结果能反馈给模型更新参数,形成干湿闭环,这也是当下行业的主流阶段。
3.0阶段:自主科研,AI自主完成“设计实验→执行实验→分析结果→迭代优化”全闭环,人类只需定方向、提问题,剩下的全交给AI智能体。
硬核落地:把蛋白质进化做成全自动工作流
要实现AI4S 3.0,团队选择从蛋白质这个生物分子的核心对象切入,目标是:让蛋白质连续定向进化,变成完全无需人工干预的自主工作流。
王承志团队打造的自动化平台,核心是一个“物理世界的AI智能体”(而非数字世界的聊天机器人):
每轮实验数据出来后,系统自动分析结果、设计下一轮实验;
把实验设计转化为机器人可执行的指令,驱动设备完成实验;
连续运行1个月无人工干预,自动完成培养、传代、检测、筛选;
防污染设计拉满(HEPA过滤、UV灭菌等),全程无交叉污染;
能动态调整实验策略,自动处理设备故障、生长异常等问题。
自主实验室实现从设计、执行到反馈的全流程
这套平台被《Nature Chemical Engineering》评价为令人震撼,不仅登上封面,还配发专题评论,定义为“全球首个工业级、可编程、自动化的蛋白质连续定向进化平台”。
Shen et al. Nature Chem Engineering 2025
案例1:用“生物逻辑门”筛选精准转运的蛋白变体
多重耐药外排泵LmrA是个难题——它会无差别转运底物,既转目标物质,也转非目标物质。要筛选出“只转目标、不转非目标”的变体,需要二维筛选:A=1(转目标)且B=0(不转非目标)。
团队设计了NIMPLY生物逻辑门遗传线路,结合自动化平台连续运行1个月,成功进化出符合要求的LmrA变体——原本看似无解的多目标筛选,被自动化+AI的组合高效攻克。
团队设计的生物逻辑门电路
案例2:融合出5倍活性的mRNA疫苗关键酶
mRNA疫苗生产有个痛点:成本高、损耗大,原因之一是工艺要分两步走:先靠T7 RNA聚合酶转录RNA,再用另一个加帽酶给RNA加上 5' 端的帽子,中间还要纯化,损耗非常严重。
客户提出的需求是:把两个酶融合成一个兼具双活性的新酶。听上去合理,但难点在于,简单融合会让两个酶的活性全消失,只能从零进化。
团队把这个挑战交给自动化平台,挑战非常成功:
连续运行1个多月无污染;
自主记录、分析、迭代实验;
几乎没有人参与;
最终进化出CapT7融合酶,不仅兼具双活性,转录活性还比原始T7酶提升5倍!
短期内AI4S还不是“客户云端点鼠标就能做实验”的状态——需要大量工程师维护复杂的自动化设施,AI4S公司更像“工程+科学”的混合体。
但随着自动化实验通量越来越大,整套体系会越来越复杂,我们的长期目标是把科研环节变成可交易的token——科学家设计新分子,能马上拿到测试结果。
我们离AI4S 3.0还有多远
虽然我们的长期目标是要实现“自主科研”的,可自我迭代的AI4S 3.0系统,但当前还有很多问题需要解决。一些典型的问题例如:
为什么AI模型在科学领域的幻觉比通用大模型更隐蔽、更危险?
AI模型在通用领域,通常靠常识就能看穿。但在科学领域却完全不同,因为它不但看起来是对的,而且看起来很专业,通常都带着令人信服的置信指标。最危险的是,科学AI的幻觉往往位于"合理但错误"的 sweet spot——不是胡说八道,而是那种"差一点点就完美了"的精致错误。
这类错误常如果被下游研究者当作起点,会污染整个研究链路,造成错误的级联放大。对于自主实验室来说,因为更少人为介入,幻觉会更容易在错误的道路上浪费大量资源甚至造成严重后果。
为什么AI预测很快,实验验证却排队排到“下辈子”?
AI的产出是指数级增长的,实验的产能是线性甚至恒定的。AlphaFold在几分钟钟内预测出蛋白质结构,但实验的验证常常需要数月甚至数年。因此生成式AI和当前的实验范式构成了行业的根本矛盾。
我们在上面的案例中,通过一些生物学体系的设计,极大降低了实验通量的需求,例如自主进化体系可以把起始样本减少数万倍,这本质上是用生物体系的自动化来替代物理实验的自动化。
另一方面,较少人工干预的自动化实验室能在一定程度上减轻实验的压力。因为自主系统可扩展性极强,不依赖于有经验的实验人员。在数据成为AI时代最重要的资产时,未来谁拥有最大化的自动化实验产能,谁就能掌握行业主导权。
为什么绝大多数开源科学代码只能被阅读,却永远无法直接运行?
学术界的开源代码在很多时候并不会考虑工程化的问题,很多代码环境依赖死锁、无测试无文档、不关心异常处理、日志、模块化等等。这和工业界的可稳定复现的要求完全不同。
这三个问题本质上指向同一个命题:AI在科学领域不是加速了发现,而是加速了"猜测"的产出。它生产假说的速度远超人类验证假说的能力。当猜测的库存积压到实验验证无法消化的程度,整个系统的瓶颈就不再是想象力,而是物理世界的执行带宽。只有当物理世界的执行带宽和AI的生成能力对齐时,AI4S 3.0才能真正到来。
当AI自主做科研,我们该警惕什么?
AI自主科研带来科学发现爆炸式增长的同时,也有三个值得深思的问题:
理论膨胀成新瓶颈
AI 具备强大的算力与学习能力,可以无限地生成新的科学理论与假设。但理论再先进,最终都需要物理实验来验证;实验受限于时间周期、特殊材料制备、能源消耗等现实条件。这两者之间的差距,会催生一个新现象——理论膨胀。
这种“理论膨胀”不仅是研究效率的错位,更可能引发一场科学界的“选择困境”。当 AI 在一个下午就能推演出数以万计具有逻辑自洽性的新材料结构或亚原子粒子模型时,人类科学家将面临前所未有的筛选压力:在资源有限的现实世界中,究竟哪一个假说才值得耗费十年的时间和数十亿的经费去建造对撞机或实验室?
科学探索的重心正在从“如何发现”转向“如何筛选”,若验证速度跟不上推演速度,人类的知识库将充斥着大量处于“量子叠加态”的待定理论——它们在数学上完美无瑕,在现实中却迟迟无法落地。
科研劳动的商品化
当AI能完成科研全链条,科研会从“精英智力活动”变成“可量化、可交易的商品”——就像云计算一样,变成一种可批量购买的计算服务。普通人也能低成本做科研(比如有人用Claude做基因测序、自己设计mRNA疫苗治宠物)。
再往前推,做科研可能不再是 scientist 这个群体的专属,而是变成 token、变成商品。这种转变可能会导致传统的学术职业路径发生根本性萎缩——我们将不得不重新思考科研人员的角色定位。
科研加速的不均等性
AI自主科研高度依赖算力、数据、自主实验室——拥有这些资源的机构/国家,会在科学竞争中占据绝对主导,小国家、独立研究者可能被边缘化,形成“发现垄断”。这会加剧全球科研领域的不平等。
未来科学发现的竞争,可能不再属于最聪明的人,而是取决于谁有最大算力、谁有最多自主实验室、谁有最完整的数据飞轮。
现在的AI已经能自主通关游戏。它会自己尝试、自己失败、最后用人类完全理解不了的方式通关。当年 Google 之所以以 4 亿美元收购 DeepMind,就是因为看到他们能用 AI 把游戏玩得非常好。后来DeepMind的表现完全证实了这一点,当AI能从自主尝试中学会一切,人类的经验将逐渐被边缘化。
那么,以后 AI 自主发现科学的路径,会不会也用我们这些科学家完全无法理解的方式去重新发现科学?
AI4S的3.0时代,已经在路上。当机器能自主做科研,科学的边界,又会被推向哪里?
作者简介
王承志,智源深澜创始人兼CEO,曾任镁伽科技首席科学家,于2024年创立智源深澜,专注于数据驱动的生物分子设计与制造。公司打造了全球首个工业级、可编程的自动化蛋白质连续定向进化平台,实现了科研全流程的 AI 自主闭环,相关成果登上《Nature Chemical Engineering》封面,推动AI for Science从2.0“导航式设计引擎”向3.0“科学智能自主平台”演进。
想要了解更多AI for Science创业项目?有BP想要投送?或者想来分享你的真知灼见?添加果壳硬科技企业微信,私信沟通。
未来光锥
部分已投项目
华天航空动力
丨天璇新材料
关注话题
闭门活动
热门跟贴