一位科技公司首席执行官解释了为什么人工智能可能短期内无法治愈疾病,仍然需要人类。

凯文·鲁斯、凯西·牛顿和瑞秋·科恩

AI摘要与评论

这段对话以冷静、务实的技术视角,对人工智能将彻底改变科学和医学的种种宏大承诺提出了反驳。通过与科学家、技术专家、FutureHouse 和 Edison Scientific 的创始人 Sam Rodriques 的深入对话,主持人探讨了一个核心问题:如果人工智能如此强大,为什么它还没有治愈疾病或以显而易见的方式改变科学发现?

罗德里格斯的回答既不轻蔑也不理想化。相反,他重新定义了问题。人工智能,例如Kosmos这类工具所体现的人工智能,已经在改变科学——但这种改变是特定且有限的。Kosmos 并不会自主地发明治疗方法;它加速了研究的分析阶段。通过阅读数千篇论文、编写数万行代码以及整合庞大的数据集,它可以在数小时内完成相当于人类数月分析工作的任务。至关重要的是,这种加速是通过实证研究来衡量的:Kosmos 重现了人类研究人员花费数月时间才发现的未发表的研究成果。在某些情况下,它甚至提出了真正全新的假设,例如识别出将基因变异与 2 型糖尿病联系起来的机制。

然而,罗德里格斯反复强调,这只是科学流程的一部分。科学包括决定收集哪些数据、收集数据,然后解释数据。Kosmos 主要解决的是第三步。更深层次的瓶颈——实验设计、数据生成、临床试验、患者招募、生产制造和监管审批——仍然顽固地依赖于人、材料,而且进展缓慢。这就是为什么罗德里格斯认为人工智能“十年内治愈所有疾病”的说法难以置信。即使假设完美无缺,生物学的发展也遵循着任何计算都无法压缩的时间尺度。

这段对话的价值尤其在于它驳斥了一个常见的误解:即智能不足是医学发展的主要障碍。罗德里格斯认为,真正的限制在于知识的匮乏和实验中不可避免的不确定性。即使是拥有无限智能的系统,也无法推断出从未经过实证检验的世界事实。人工智能可以帮助设计更完善的实验,但它无法取代实际操作实验的必要性。从这个意义上讲,这段对话巧妙地抵制了技术决定论的叙事,并重申了科学实践核心的认知谦逊。

另一个关键主题是可靠性。Kosmos 和人类一样,也会犯错。它的输出结果需要仔细解读和验证,但罗德里格斯将其重新定义为一种延续性而非危机:科学家们已经花费大量时间互相检查彼此的工作,而且验证的速度总是比最初的发现更快。真正的风险并非错误本身,而是将速度误认为确定性。

讨论还将 Kosmos 置于更广阔的“人工智能服务于科学”的背景下。Rodriques 明确区分了科学过程建模(生成假设的智能体)和自然世界建模(例如 AlphaFold 或生成式抗体设计等系统)。后者,尤其是生成式生物模型,代表着一次深刻的变革:从头设计蛋白质、抗体甚至生物体的能力。这些进展或许比解决数学奥林匹克难题等象征性里程碑更具变革性,尽管它们更难衡量,验证也更耗时。

或许最具哲学趣味的是关于“意外发现”的讨论。科学突破往往源于错误、噪声或天真的实验——这些特征似乎与以优化为导向的人工智能系统相悖。罗德里格斯认为,人工智能科学家或许需要刻意保留甚至人为地引入随机性和误差,这与生物进化本身遥相呼应。这一见解巧妙地挑战了“进步只能来自效率”的假设。

总的来说,这段对话在不削弱人工智能驱动科学重要性的前提下,揭开了其神秘面纱。它描绘了一个未来:人工智能不会取代科学家,而是重塑他们的认知劳动——将数月的分析压缩到几天之内,拓展假设空间,并促使人类扮演更具策展性和解释性的角色。这场变革即便到来,也会比炒作所暗示的更加悄无声息、缓慢推进——但其意义却丝毫不减。

正文

打开网易新闻 查看精彩图片

各大人工智能实验室的负责人认为,人工智能将开启科学发现的新时代,帮助我们治愈疾病,并加快应对气候危机的能力。但迄今为止,人工智能究竟为科学做出了哪些贡献呢?

为了更好地了解情况,我们采访了萨姆·罗德里格斯,他是一位从科学家转型为技术专家的学者,目前正通过其非营利组织FutureHouse和一家营利性衍生公司Edison Scientific开发用于科学研究的人工智能工具。Edison Scientific最近发布了Kosmos——一款人工智能代理(或者用该公司的话来说,是一款人工智能科学家),该公司声称它只需运行12小时即可完成相当于六个月博士或博士后水平的研究工作。

Sam 向我们详细介绍了 Kosmos 的工作原理,以及为什么像这样的工具能够显著加快数据分析速度。他还探讨了为什么一些关于人工智能治愈疾病的惊人说法并不现实,以及在真正实现人工智能加速的未来道路上仍然存在哪些瓶颈。

以下是我们对话的文字记录,为了清晰简洁,略作编辑。

罗斯:所以,我们今天请您来担任科学专家,为我们介绍近期人工智能在科学领域取得的重大突破。我隐约知道这个领域很重要,也知道它正在发生很多大事,但我们俩都不是科学家,虽然我小学时确实做过一个很棒的小苏打火山。所以今天我们有很多话题要聊,但在深入探讨细节之前,我想先问问您一直在进行的项目。上个月,您非营利组织的商业部门——爱迪生科学公司——推出了一款名为Kosmos的人工智能科学家。您说,Kosmos一次运行就能完成相当于博士或博士后六个月的工作量。请您介绍一下Kosmos的工作原理,以及这个“六个月”的数字是怎么来的。

罗德里格斯:没错,正是如此。实际上,我想先说明一下,当我看到六个月的数据时,我的第一反应是“这不可能”,对吧?现在我们已经用多种不同的方法进行了验证。我可以详细地向大家解释一下。但简单来说,我们花了两年时间研究如何构建一个人工智能科学家。这里的核心理念是,我们能做的科学研究远远超过了我们拥有的科学家数量,对吧?那么,我们该如何扩大科学研究的规模呢?Kosmos 最酷的地方在于,我认为它是我们开发的第一个真正让人感觉像人工智能科学家的工具,当你使用它时,你会感觉它就像一个真正的人工智能科学家,对吧?也就是说,你输入一个研究目标,它就会进行研究,然后返回一些非常深刻、有趣的见解,这些见解有时是错误的,但大约 80% 的情况下都是正确的。这有点像你让一个人离开去做某件事,他回来后有差不多的概率做对。而且,使用这种方法是一种全新的体验,所以非常令人兴奋。

具体来说,我们计算六个月这个数字的方法是这样的:我们找了一群学术合作者,他们都是之前做过很多研究但尚未发表的科学家。我们把同样的研究目标和数据集交给人工智能系统 Kosmos,让它去进行新的探索和发现。结果它回来后发现的和研究人员一夜之间发现的完全一样。然后我们再去问这些研究人员,他们最初花了多长时间才发现这些?他们会说三个月、五个月、六个月等等。这就是六个月这个数字的由来。也就是说,这就是他们得出这个发现所花费的时间。

凯西·牛顿:那我先问几个问题,好让我更好地了解情况。这个工具是不是像其他聊天机器人一样,是一个可以输入文字的框?如果是的话,它的技术基础是什么?你们是从零开始构建自己的模型吗?还是在其他公司的模型基础上进行了微调?

罗德里格斯:没错,就是这样。它确实是一个输入框,你可以在上面输入内容。你可以向它提出一个研究目标。它不是聊天机器人,对吧?它会运行大约12个小时,最终将结果反馈给你。在构建方面,我们基于OpenAI、谷歌和Anthropic等公司提供的多种语言模型。每次运行,我们都会使用来自不同供应商的模型。我们还有一些针对特定任务的内部训练模型,这些模型比前沿供应商提供的模型更适合我们训练的特定任务。Kosmos的关键在于它使用了我们称之为“结构化世界模型”的东西。目前人工智能系统的一个主要局限在于,它们能够执行的任务长度和复杂程度都有限,超过这个限度就会失控。它们会忘记自己正在做什么,不再专注于任务。我们最终找到了一种方法,让他们能够为这个随着时间推移而不断构建的世界模型做出贡献,这个模型基本上描述了他们正在执行的任务的全部知识状态。这意味着我们可以协调数百个不同的智能体并行或串行运行,并让它们朝着一个共同的目标努力。这才是真正的突破。

罗斯:没错。我觉得 Kosmos 还有一点很有意思,就是它的价格。这个型号每个提示要 200 美元。

罗德里格斯:是的。

罗斯:所以每次你给它布置任务,都要支付 200 美元。为什么这么贵?

罗德里格斯:我的意思是,它需要大量的计算资源。我的意思是,最根本的答案就是它需要大量的计算资源,对吧?

罗斯:比如,让我们大概了解一下有多少。

罗德里格斯:嗯,Kosmos 每次运行平均会编写 42,000 行代码,并读取 1,500 篇研究论文。相比之下,Claude 可能只会编写几百行代码,对吧?所以你应该能体会到其中的差别。这需要大量的计算资源。

牛顿:你有没有遇到过这样的科学家:他的猫走过键盘,不小心按了回车键,结果一下子花了 600 美元?

罗德里格斯:这确实是个问题。这确实是个问题。所以,你必须明白,如果你是一名科学家,你去做一个实验,收集一些数据,你可能要花费5000美元或10000美元。因此,科学家们想要的是尽可能最佳的性能。像那些使用过Kosmos的科学家,他们通常会回来告诉我,他们简直不敢相信我们只收200美元,对吧?你知道,我会说,现在的200美元是促销价。实际上,我们最终还是要涨价的。

罗斯:哦,它正在上涨。所以圣诞节前赶紧把那些提示发过来!

罗德里格斯:没错。但说真的,你知道,如果你要花几千美元收集数据,最终限制因素就不是成本了。我们必须在退款方面非常慷慨,因为人们总是会犯错。

牛顿:啊,我打错字了。

罗德里格斯:没错,正是如此。

罗斯:所以你刚才提到的那些测试,比如你们为了弄清楚这个系统能运行多久,能为科学家节省多少时间而进行的测试,其实就是对现有研究的重复。但我们从那些运营大型人工智能实验室的人那里听到的很多说法是,人工智能很快就能做出全新的科学发现。我们将开始做一些现有科学方法和流程无法完成的事情。我们离那一天还有多远?

罗德里格斯:实际上,这种情况已经发生了。如果你去阅读我们发表的关于“宇宙号”探测器的论文,你会发现我们提出了七项结论,其中三项是对现有发现的重复验证,四项是对科学文献的全新贡献,例如新的发现。

牛顿:那么,在这些成就中,哪一项最令人印象深刻?

罗德里格斯:所以,我们非常喜欢的一个例子是,人类基因组包含数百万个基因变异,对吧?这些是不同个体DNA之间的差异,与疾病相关。大多数情况下,我们知道某个变异与某种疾病相关,但我们不知道为什么,对吧?所以我们向Kosmos提供了大量关于不同遗传因素的原始数据,比如变异是什么,哪些蛋白质与变异附近结合等等,然后我们让它针对2型糖尿病,识别与其中一个变异相关的机制。结果它发现,这是一个不在基因中的变异。Kosmos识别出,它实际上与另一种蛋白质结合。它能够识别出结合的蛋白质以及正在表达的基因,并将这些信息与该基因的实际机制联系起来,即SSR1基因,该基因参与胰腺分泌胰岛素,对吧?

牛顿:好的,所以我的理解是,你的模型能够对一些现有数据进行非常巧妙的推理,并识别出一些其他人类科学家尚未发现,而且可能在很长一段时间内都无法发现的东西?

罗德里格斯:是的,没错。

牛顿:好的。

罗德里格斯:我认为科学研究通常包括决定收集哪些数据、收集数据,然后得出结论。所以,基本上,目前这就像“宇宙号”探测器所针对的第三步。你知道,还有更多的工作要做——

牛顿:你漏掉了第零步,也就是让特朗普政府解冻你的资金。但其他方面都对。

罗德里格斯:(笑声)

罗斯:那么,当你从科斯莫斯探测器那里获得这样的发现时,接下来会发生什么?你需要去验证它吗?你会把它交给一个研究团队,让他们确保它有效吗?接下来会发生什么?

罗德里格斯:是的,当然。你必须去验证它。实际上,这也是我们在论文中描述如何验证特定变体的原因之一。一般来说,当人们使用它时,是的,你需要进行一些操作。我的意思是,实际上,当你运行一次 Kosmos 程序时,你首先要做的是理解它告诉你的信息。因为它完成的工作相当于科学家们六个月的工作量,你需要花很长时间阅读和理解它。一旦你阅读并理解了它,那么是的,你确实需要进行各种实验,进行你自己的分析,进行交叉验证,以说服自己这是真的。然后,根据你的研究目标,你将决定下一步,对吧?你知道,在这种情况下,我认为从这个特定发现中找到新药靶点的可能性很低,对吧?但是你可以继续研究其他发现,然后最终,也许你会发现新的药物靶点,启动一个药物研发项目,你知道——

罗斯:我听到人们对像 Kosmos 这样的模型表达的一种担忧是,这似乎并非真正的障碍所在。我们之所以没有更多人工智能发现的药物或设计药物来治愈疾病,并非因为我们缺乏发现这些药物的研究方法,而是因为药物研发还需要进行临床试验、招募人体受试者并获得 FDA 批准。所有这些都比实际发现药物本身花费的时间要长得多。那么,像这样的模型目前在我们的科学进程中究竟在帮助解决哪些问题呢?

罗德里格斯:没错,完全同意。我非常赞同,解决医学难题的瓶颈最终在于临床试验。最简单的例子就是看看我们能在小鼠身上治愈多少种疾病,对吧?数量惊人,因为显然我们可以直接进行实验,但在人体试验中,进展就非常缓慢。也就是说,如果你认为制药公司现在进行的每一个实验,比如每一项临床试验,都是基于现有全部知识精心策划和设计的,那你就太天真了,对吧?根本不可能。而且这些实验耗资数亿美元。所以问题是,我们最终还是要进行临床试验。那么,我们如何确保这些实验是在我们掌握所有知识和数据的情况下所能进行的最佳实验呢?我们拥有大量数据,其中蕴含着等待被发现的洞见,只是我们缺乏人手去发现它们,而这最终将有助于我们进行更好的实验和试验,对吧?

牛顿:那么,我很好奇您认为您的工具将如何融入当今科学家的工作流程。比如,我已经完成了实验,现在需要一些分析方面的帮助吗?或者,我有一些以前只做过少量分析的实验,想知道是否还能从中挖掘出更多价值?或者,您认为人工智能目前还能在哪些方面真正帮助到科研人员?

罗德里格斯:是啊,问得好。让我回到2019年,也就是我即将完成博士学位的时候。当时我有一个庞大的数据集,而且我当时想毕业,因为我是博士生,这意味着我一年能挣4万美元左右,有很多机会可以出去工作,不再做博士生了。好吧,所以我花了整整六个月的时间坐在书桌前,试图分析数据、得出结论、阅读论文等等。现在,Kosmos 正好可以解决这个问题。你知道,你只需要把数据集交给 Kosmos,它就会得出很多结论。目前,你还需要做很多手动工作来验证这些结论等等。很快它就能得出结论,而你就会说:“太好了。”

罗斯:萨姆,我想请你帮我们和听众介绍一下目前人工智能科学领域的现状。最近,白宫宣布了一项名为“创世纪计划”(Genesis Mission)的联邦项目,旨在收集和利用联邦政府掌握的所有数据集,并将其用于新的科学探索。我们也有很多类似的项目,包括你自己的项目,以及科技行业、生物技术行业、材料科学领域的人工智能研究等等。请你大致介绍一下目前人工智能科学领域的热点是什么,以及资金和精力都投入到了哪些方面?

罗德里格斯:没错。要理解人工智能和科学的现状,首先,也是最根本的一点,你必须明白人工智能的本质是构建模型,对吧?比如说,语言模型,那么什么是语言模型呢?语言模型本质上就是人类语言的模型。恰好,当你构建一个人类语言模型时,它会在某种意义上学习像人类一样思考,因为人类是用语言来编码他们的思想的。这可以说是最伟大的发现之一,对吧,当然是21世纪最伟大的发现,甚至可能是史上最伟大的发现之一。同样地,当我们谈论人工智能在科学领域的应用时,你必须明白,你是在对事物进行建模。这就是人工智能的本质。这里大致可以分为两大类:一是模拟自然世界,对吧?二是模拟科学研究过程。这两者本质上是不同的,之所以要区分它们,是因为,你知道,我们正在做的,对吧,我们正在模拟科学研究的过程。人工智能在科学领域的另一面是构建模型,例如,可以预测蛋白质的结构,可以生成新的抗体,可以从头开始创造新的生物体,所有这些都是 2025 年即将发生的事情,势头非常强劲。

罗斯:是的,这很有道理。我的意思是,在模拟自然世界的过程中,你提到了蛋白质折叠、新型生物体等等,作为一名科学家,你所看到的哪些现象最让你兴奋?

罗德里格斯:所以,我认为目前最令人兴奋的,毫无疑问,就是我们所说的生成模型的发展趋势。这些模型可以从零开始生成具有所需特征的蛋白质、抗体或其他任何东西。这是我们以前从未拥有过的全新能力,意义非凡。

牛顿:我很好奇你做这些实验时遇到的可靠性问题。你知道,我这周在社交媒体上看到一个说法,我自己也验证了。如果你问谷歌:“2026年是明年吗?”它会回答:“不,2026年不是明年,而是后年。”所以,萨姆,在这种情况下,有些人可能会担心我们现在把所有的数据分析都交给人工智能。那么,科学家们需要花多少时间去重新检查人工智能的工作?这会给他们的工作带来多大的影响?

Kevin Roose 和 Casey Newton 是播客节目《Hard Fork》的主持人,该节目旨在解读瞬息万变的科技世界。欢迎订阅收听。

罗德里格斯:是啊,这太搞笑了。我的意思是,你看,你得花很多时间回头检查。但说清楚点,不管是人工智能做的还是你让朋友做的,情况都是如此。如果你要发表论文,你最好回头检查一遍,确保自己有信心。而且永远不可能百分之百准确,对吧?你所能做的最好的就是达到和你自己做的差不多的水平,但这并非百分之百准确,因为你不可能完美无缺。而且检查工作总是比一开始就写出来要快得多。快得多。

罗斯:历史上许多最伟大的科学突破都源于这类奇特的偶然事件,这类意外发现的时刻。你知道,青霉素在培养皿中开始生长,我们突然意识到,“天哪,这太棒了!”人工智能会保留这种意外发现吗?还是会通过某种优化手段将其消除?

罗德里格斯:是的,这是一个很好的问题,但事实是我们目前真的还不知道。这将是一个非常重要的核心问题,很多人都在问。

鲁斯:你对此有何直觉?

罗德里格斯:我认为他们很可能会这么做,因为——

罗斯:他们大概会把它保存下来吧?

罗德里格斯:他们可能会保存下来,因为青霉素的发现,据我了解,基本上就是把一扇窗户打开,放在一些没有添加抗生素的琼脂上。显然,当时他们还没有抗生素,因为这是第一个抗生素的发现,对吧?所以,窗户打开,上面放着一些琼脂,一些孢子飞到上面开始生长,他们观察到细菌受到了抑制,对吧?这是一个错误。有人搞砸了,对吧?而这个错误却带来了惊人的发现,我认为,总会有一些错误被保存下来。

牛顿:但与此同时,科学家们应该始终敞开窗户。你永远不知道会发生什么。

罗德里格斯:你没听错,说真的,学术界有很多东西值得挖掘,对吧?尤其是研究生,一年级的研究生,他们根本不知道该做什么。他们完全不知道该做什么。而这正是科学进步的巨大源泉,因为他们会做一些最随机、最古怪的事情,那些真正懂行的人想都想不到,但实际上,这些事情真的非常重要。

Roose:你几乎希望你的人工智能科学家模型能产生一点幻觉。

罗德里格斯:完全正确。或者说,就是增加噪音,对吧?我们讨论过,这就像是为了增加噪音,而这实际上对生物进化也很重要,对吧?比如基因组里有很多噪音,进化就是这样随机地产生新的东西的,就像有一种蛋白质,一开始完全随机,什么也不做,然后有一天,突然之间,哎呀,它开始起作用了,这很棒,对吧?

Roose:你如何看待像 Demis、Dario 和 Sam Altman 这样的大型人工智能实验室的领导者,他们说,“人工智能将在未来一二十年内使我们能够治愈所有疾病或大多数疾病”?

罗德里格斯:这十年真是疯狂。哦,我很乐意在这件事上表明我坚定的立场,因为如果我错了,那岂不是好事吗?如果我错了,那大家都是赢家。总之,这十年真是疯狂。

罗斯:为什么说这是疯狂的?

罗德里格斯:因为,正如我们之前讨论的那样:你必须进行临床试验。如果我们现在有一种药物可以阻止衰老,完全阻止25岁到65岁之间人类的衰老,你也得等上十年才能知道结果,因为在这个年龄段,你至少需要五到十年的时间才能检测到人类是否在衰老。也就是说,你无法在一年之内检测到衰老。所以,你无法知道这种药物是否有效。

牛顿:我不知道。我高中毕业十年同学聚会上,有些人看起来已经很憔悴了。

罗德里格斯:(笑声)

牛顿:真不想这么说。

罗德里格斯:我的确说过是 25!

牛顿:好吧,有道理。

罗德里格斯:没错。我的意思是,我们必须进行实验。这些实验需要时间。现在,30年,我认为是完全有可能的。我们不知道未来会发生什么。我们不知道是否有可能阻止衰老。我们不知道是否有可能治愈所有疾病等等,但从现在到未来30年,我认为我们应该会看到我们在知识方面取得巨大的飞跃。

牛顿:让我再深入探讨一下,因为我觉得有些人可能会误解,认为这本质上是一个监管问题,我们目前还没有相应的机构,比如FDA,来衡量这方面的情况。不过,我对实验方面更感兴趣。因为据我了解,我们没有足够的生物学家来开展所有我们想做的实验。我们可能也没有足够的资金来支持这些实验。而且您也提到过,有些实验确实需要很长时间才能完成。那么,您认为有哪些因素会导致疾病防治工作如此困难呢?

罗德里格斯:我的天哪。你得去,你知道,就算你有一个想在人体上测试的分子,也知道你想在哪些人身上测试,你还得去制备它,对吧?人体很大,需要大量的药物。你必须确保它的纯度足够高,才能真正用于人体。你得找到病人,这意味着要和医生建立关系,对吧?实际上,你知道,你得等到有足够多的病人愿意做试验。很多疾病的病人本来就不多。所以找到病人很难,对吧?然后你还得给他们用药。你得等着看结果,对吧?即使没有监管,这个过程也会很慢。

牛顿:是的。几乎所有这些问题都没有人工智能的捷径可走,至少目前还没有。

罗德里格斯:不,人工智能能让我们做的是,它能让我们发现很多我们已经掌握了相关信息的事物。我们只是还没弄明白而已。人工智能研究人员有时会谈到另一点,这可能不太合理,那就是你不应该指望有一天你能得到GPT-7,然后问它如何治疗阿尔茨海默病,它就能告诉你答案。我的预期是,我们掌握的知识还不够。原则上,即使拥有无限的智能,我们也没有足够的知识来解决这个问题,对吧?即使拥有无限的智能,仍然会有一些关于世界的未知领域,我们需要通过实验来探索。你可以根据已知的一切来设计最佳的实验方案,但你不可能从零开始,完全摸索出答案,对吧?

罗斯:凯西,我学过拉丁语。拉丁语的意思是“来自新的”。

牛顿:哦,谢谢,谢谢。这省去了我上网搜索的步骤。

罗斯:这严格来说不算科学,但我很好奇你对此有何看法,萨姆。所有的大型人工智能实验室都痴迷于数学,痴迷于赢得国际数学奥林匹克竞赛,痴迷于获得金牌,痴迷于破解那些未经证明的数学定理。我对此有个看法,我认为这是因为这些实验室里的人本身就是高中时期的数学竞赛选手,参加过国际数学奥林匹克竞赛并且成绩斐然。他们中的许多人认为通用人工智能(AGI)只不过是比他们稍微聪明一点的版本。但我很好奇,为什么这些机构如此痴迷于数学,并希望在数学领域取得重大进展?

罗德里格斯:原因有二。我认为其中一个原因正如你刚才所说,大家都很熟悉,对吧?另一个原因是你可以衡量进步,对吧?所以,归根结底,就像机器学习的进步一样,很大程度上取决于基准。在数学中,你可以判断你的证明是否正确。而且,需要证明的东西几乎是无穷无尽的。因此,很容易判断你是否在进步。像国际数学奥林匹克竞赛(IMO)这样的项目就提供了绝佳的机会。相比之下,如果你看看最近一些最大的突破,比如今年生物学人工智能领域最大的突破,对吧?像Chai Discovery和Nabla这样的公司,他们开发出了从头合成抗体的非常优秀的模型,对吧?这是巨大的突破,但最终,对他们来说真正的胜利要等到它被批准用于人体试验,而这可能还需要五年左右的时间。Arc Institute则首次实现了从零开始设计生物体,他们设计了一种噬菌体。它是一种能感染细菌的病毒。很神奇,对吧?但它的评估就比较困难。比如,它到底有多好?毕竟,你不可能把它释放到自然环境中,所以评估起来就比较困难,而免疫分子(IMO)则非常纯净。因此,我认为我们一直在思考的一个问题是,如何才能找到真正清晰的基准,来衡量我们在科学研究方面做得是否出色?

罗斯:我这里有个答案:国际癌症治愈奥林匹克竞赛。

牛顿:我喜欢这个。

鲁斯:我们开始吧?

牛顿:我觉得那太好了!

罗斯:我们可以给赢家颁奖。呃,实验室,咱们赶紧行动起来。所以,当这些公司的CEO或领导人发表诸如“我们将在未来10年或15年内,或者他们给出的任何时间表内,利用人工智能治愈所有疾病”之类的言论时,他们这样做是因为他们不了解其中的瓶颈吗?我的意思是,这些人都是非常聪明的人。那么,他们究竟忽略了什么?或者他们只是在进行某种营销活动?这是不是为了让那些原本可能对人工智能感到恐惧的人对它产生兴趣?他们为什么要做出这些预测?

罗德里格斯:不,你看,我的意思是,我认为他们是——当然,理性的人可能会不同意。有很多理由可以论证,这些模型实际上会变得非常智能,它们会找到方法在进行临床试验之前就衡量我们是否取得了进展,这将加快迭代周期,对吧?关于这一点,有很多合理的论点,对吧?比如,你知道,我们可能不再进行完整的临床试验,而只使用生物标志物。这并非异想天开,当然,我也可能错了,也许10年后,我们就能治愈所有疾病。所以,这是其中一部分原因。显然,还有一部分原因是他们想炒作这件事。还有一部分原因是,你知道,萨姆·奥特曼真的非常了解生产,比如扩大小分子药物的生产规模,最终将其投入临床应用需要付出多少努力吗?可能并不了解,对吧?所以,这里面有很多因素。我觉得这其中没有任何恶意。只是大家都很兴奋而已。当然,现实总会在某个时刻与我们擦肩而过。我们拭目以待,看看究竟会在哪里遇到这种情况,但无论如何,未来一定会很美好,对吧?

牛顿:在 2025 年的今天,您认为人工智能工具在多大程度上改变了科研人员的生活?您预计一年后情况会有多大不同?

罗德里格斯:我认为你会惊讶于他们至今还没有采用新方法。科学家们普遍非常保守,因为如果你在做实验,你永远无法真正完全了解,至少在生物学领域,你通常无法完全理解实验成功或失败的原因。有些东西是你从过去运行的实验方案中继承下来的,你会觉得“我们一直都是这么做的”。你可以去验证它,但需要验证的东西太多了。所以,你基本上被困在现有方法里,因为这些方法有效,你只想做有效的方法。因此,生物学家采用新方法的速度很慢。我认为世界各地的大多数实验室可能仍然沿用他们以前的方式进行科研,而且可能还会继续这样做一段时间,这也没什么问题。我认为在编程领域,很多人已经开始采用它了,因为在生物学领域,编程历来是一个很大的瓶颈。现在,生物学家们,尤其是那些不懂编程的人,能够利用 Claude Code、OpenAI 的模型、Gemini 等工具进行大量的编程工作,这无疑是一项巨大的突破。我认为这将很快得到广泛应用。文献检索也是如此,能够解析浩瀚的科学文献,这同样是一项巨大的突破,也将很快得到普及。我们正在开发的这类工具则更偏向于前沿技术。最终 ,当人们看到其他人使用这些工具并取得显著成果时,他们自然也会采用它们。

罗斯:萨姆,我们来玩个快问快答的小游戏吧?我们管这叫“被过度炒作/被低估”。我们会告诉你一些事情,你根据你的科学判断,说说它是被过度炒作还是被低估了。准备好了吗?接下来是验证环节。人工智能系统会用数学方法进行证明。

罗德里格斯:如果非要我选,那可能被过誉了。它作为人工智能领域的进步驱动力固然很好,而且擅长这项技术或许会对其他领域产生影响,但它本身真的那么有用吗?我不太确定。

Roose:用于人工智能实验室自动化的机器人技术?

Rodriques:机器人技术是用于自动化人工智能实验室,还是……?

罗斯:是的,或者用于科学实验室的自动化。

牛顿:比如,湿实验室。

罗德里格斯:用于自动化科学实验室的机器人技术。嗯,我觉得被炒作得恰到好处。它将会彻底改变世界。这项技术目前还远未成熟。我们还有很多工作要做,但总的来说,是的,可能被炒作得恰如其分。

牛顿:AlphaFold 3?

罗德里格斯:这很有意思。我的意思是,我觉得它可能被低估了,因为我觉得所有蛋白质结构模型都备受关注,但它们将会带来巨大的变革。所以,我觉得它可能被低估了。不过,它确实也备受关注,所以很难做出判断。

罗斯:虚拟细胞?今年夏天,我们从帕特里克·科利森那里了解到弧形研究所是如何创建虚拟细胞的。

罗德里格斯:这有点被过度炒作了,但也有其原因。Arc 正在构建的模型非常棒。新极限公司(New Limit)和陈·扎克伯格也在做类似的事情。很多优秀的公司和组织都在做类似的事情。我认为把它称为虚拟细胞有点言过其实,对吧?毕竟,这种模型模拟的是一些非常具体的东西。比如,真正构建一个虚拟细胞,能够在计算机中模拟一个细胞,这是一个了不起的目标。我们离这个目标还很远。

牛顿:量子计算?

罗德里格斯:被过分吹捧了。

鲁斯:脑机接口?

罗德里格斯:哦,老兄,这个问题真难回答。我觉得是被过度炒作了。我非常相信脑机接口(BCI),但我认为真正有效的脑机接口,或者说我们在科幻作品中想象的那种脑机接口,比人们想象的还要遥远。即使是Neuralink公司也取得了惊人的进展——

鲁斯:是啊,凯西现在脑子里正想着这件事呢。

牛顿和罗德里格斯:(笑声)

罗斯:它出故障了。

罗德里格斯:那里有很多优秀的人正在取得进步,但我认为,这比人们想象的要困难得多。

牛顿:现在快到年底了。如果可以的话,请您回顾一下,您认为今年人工智能驱动的三大科学进步是什么?

罗德里格斯:是的,我认为,首先——说实话,今年是人工智能代理元年。今年人们发现了人工智能代理,所以我必须真诚地把自己,也把我们列入其中。还有谷歌的合作科学家,我的意思是,我们并不是唯一从事这方面研究的人。谷歌做得非常出色。还有很多其他的人也在做。所以,用于科学的人工智能代理绝对是重点。然后,生成式设计也正处于蓬勃发展的时期,对吧?其他的可能包括Chai和Nabla等人所做的从头抗体设计方面的工作。

牛顿:顺便说一句,我很高兴你之前在播客里解释了“de novo”的含义。这个问题被反复提及。

罗斯:是的。

罗德里格斯:抱歉,我说“从头生成”的意思就是字面意义上的从零开始生成。你不需要给它任何东西,对吧?你只需要给它一个你想让它结合的靶标,它就能从零开始生成。这意义重大,因为像Chai、Nabla等公司所追求的,基本上就是创造一个这样的世界:你可以说,“我们知道要治愈这种疾病,我们必须靶向那个蛋白质。”你只需点击一个按钮,就能得到一种抗体,明天就可以把它注射到人体里。这太棒了。它省去了人们以前必须做的大量工作。所以,这是非常重要的一点。第三点,我想说的是Arc研究所的Brian Hee、Patrick Hsu等人所做的从头生成生物体的工作。

牛顿:我们可以说出来了!我们现在知道它的含义了。这才是最重要的。

罗德里格斯和鲁斯:(笑声)

Roose:这是我们本周的“皮威的游乐场”主题词。

罗德里格斯:(笑)从头设计生物体,这有用吗?我不知道。这很棒吗?当然棒。这真是一项重大突破。

罗斯:那么,萨姆,明年我们应该关注什么?你对2026年可能即将发生的事情有什么期待?

罗德里格斯:说实话,真正迎来爆发式增长的还是智能体。我们现在正处于S型曲线的初期,而且这种增长势头还会持续下去。大概一年前,我会跟人说,我认为到2026年或者2027年,科学界产生的绝大多数高质量假设都会由我们或者像我们正在开发的这类智能体提出。而当我在2024年提出这个预测时,我觉得自己有点夸大其词了,对吧?我当时的想法是,“我需要一些宣传”。但现在看来,这或许是真的了。我的意思是,我觉得2026年就实现这个目标有点过于乐观了。毕竟,大多数优秀的假设都由智能体提出,这确实是一个巨大的飞跃。但是,到了2027年,那才叫真正的爆发。我的意思是,2026年将会是智能体开始渗透到各个领域的元年,对吧?渗透实验室,渗透人们的日常生活。我的意思是,这种情况已经发生了。

鲁斯:酷。

牛顿:是的。

罗斯:嗯,我很期待。山姆,非常感谢你给我们补习了我们在学校里明显没学到的科学知识。

牛顿:是的,你确实给我们提出了一些全新的思考方向。我很感激。

罗德里格斯:(笑)好。谢谢大家。

Where Is All the A.I.-Driven Scientific Progress?

A tech C.E.O. explains why A.I. probably won’t cure diseases anytime soon. Hint: You still need humans.

  • Share full article

Dec. 26, 2025

By Kevin RooseCasey Newton and Rachel Cohn

应对AI挑战的关键是你要学得比它更聪明。