一份来自深圳AI新锐与上海人工智能实验室的联合测试结果,把黄仁勋反复提及的“具身智能”概念,直接推进了生命科学实验室的通风橱里。

他们共同开源的ProtoPilot多智能体系统和BioLab Bench评测框架,首次跑通了从自然语言指令到湿实验物理操作的全流程闭环。简单说,一个研究员用日常语言描述实验意图,AI系统就能指挥机械臂完成移液、离心、孵育等真实操作。这套系统在多项基准测试中,把OpenAI等硅谷对手甩在了身后。

打开网易新闻 查看精彩图片

这触及了一个核心争议:具身智能的落地,到底该走通用路线,还是垂直行业先行?硅谷派认为大模型应该先理解物理世界,再下沉到具体场景。但永信至诚与上海人工智能实验室的选择很务实——先把生命科学这个任务跑通,用真实的移液器、培养皿和酶标仪来训练AI对物理世界的理解。

BioLab Bench的评测维度也透露出这种思路差异。它不测AI能不能叠积木或开瓶盖,而是看系统能否处理“把样本分配到96孔板的奇数行、每孔加200微升缓冲液”这类指令。这背后是对行业协议的理解、对精度要求的把控,以及出错后的纠偏能力。实验室环境里的物理交互,比仓库分拣复杂得多,液体体积误差达到5微升可能就意味着实验报废。

我的判断是,跨界的团队往往能打破技术路线的僵局。当OpenAI还在训练通用机器人时,这个深圳团队直接把生物学家的真实需求变成了AI的训练数据。毕竟实验室场景里,操作空间有限、任务高度结构化,反而比开放世界的物理交互更适合作为具身智能的练兵场。