鞭牛士报道,12月20日消息,据外电报道,谷歌发布了所谓的新型推理人工智能模型——但它处于实验阶段,从我们的简短测试来看,它肯定还有改进空间。

新模型名为 Gemini 2.0 Flash Thinking Experimental(名字有点拗口),可在谷歌的 AI 原型平台AI Studio中使用。模型卡将其描述为最适合多模态理解、推理和编码,能够推理编程、数学和物理等领域最复杂的问题。

在 X 上的一篇帖子中,AI Studio 产品负责人 Logan Kilpatrick 称 Gemini 2.0 Flash Thinking Experimental 是谷歌推理之旅的第一步。

谷歌人工智能研究部门 Google DeepMind 的首席科学家 Jeff Dean 也在自己的帖子中表示,Gemini 2.0 Flash Thinking Experimental 经过训练,可以使用思维来强化其推理能力。

「当我们增加推理时间计算时,我们看到了有希望的结果。」迪恩说,他指的是在考虑问题时运行模型所使用的计算量。

Gemini 2.0 Flash Thinking Experimental建立在谷歌最近发布的Gemini 2.0 Flash模型之上,其设计与 OpenAI 的o1和其他所谓的推理模型 类似。与大多数人工智能不同,推理模型可以有效地进行自我事实核查,这有助于它们避免一些通常会绊倒人工智能模型的陷阱。

缺点是,推理模型通常需要更长的时间(通常需要几秒到几分钟)才能得出解决方案。

给出提示后,Gemini 2.0 闪电思维实验会暂停一下再做出反应,考虑一系列相关提示,并在此过程中解释其推理。一段时间后,该模型会总结出它认为最准确的答案。

事情本该如此。当我问 Gemini 2.0 Flash Thinking Experimental 单词strawberry中有多少个 R 时,它回答两个。

在 o1 发布后,竞争对手人工智能实验室(不仅仅是谷歌) 纷纷推出了大量推理模型。11 月初,由量化交易员资助的人工智能研究公司 DeepSeek 发布了其首个推理模型DeepSeek-R1的预览版。同月,阿里巴巴的 Qwen 团队 公布了 其声称的首个 o1公开挑战者。

彭博社10 月份报道称,谷歌有多个团队正在开发推理模型。The Information 随后在 11 月份的报道中透露,该公司至少有 200 名研究人员专注于这项技术。

是什么打开了推理模型的闸门?首先,就是寻找改进生成式人工智能的新方法。正如媒体最近 报道的那样,用于扩展模型的强力技术不再能产生曾经有过的改进效果。

并非所有人都相信推理模型是最佳的发展方向。首先,它们往往价格昂贵,因为运行它们需要大量的计算能力。尽管到目前为止,它们在基准测试中表现良好,但尚不清楚推理模型是否能保持这种进步速度。