谷歌发布人工智能推理模型：可明确表达自己想法

鞭牛士

2024-12-20 07:25 ·北京

鞭牛士报道，12月20日消息，据外电报道，谷歌发布了所谓的新型推理人工智能模型——但它处于实验阶段，从我们的简短测试来看，它肯定还有改进空间。

新模型名为 Gemini 2.0 Flash Thinking Experimental（名字有点拗口），可在谷歌的 AI 原型平台AI Studio中使用。模型卡将其描述为最适合多模态理解、推理和编码，能够推理编程、数学和物理等领域最复杂的问题。

在 X 上的一篇帖子中，AI Studio 产品负责人 Logan Kilpatrick 称 Gemini 2.0 Flash Thinking Experimental 是谷歌推理之旅的第一步。

谷歌人工智能研究部门 Google DeepMind 的首席科学家 Jeff Dean 也在自己的帖子中表示，Gemini 2.0 Flash Thinking Experimental 经过训练，可以使用思维来强化其推理能力。

「当我们增加推理时间计算时，我们看到了有希望的结果。」迪恩说，他指的是在考虑问题时运行模型所使用的计算量。

Gemini 2.0 Flash Thinking Experimental建立在谷歌最近发布的Gemini 2.0 Flash模型之上，其设计与 OpenAI 的o1和其他所谓的推理模型类似。与大多数人工智能不同，推理模型可以有效地进行自我事实核查，这有助于它们避免一些通常会绊倒人工智能模型的陷阱。

缺点是，推理模型通常需要更长的时间（通常需要几秒到几分钟）才能得出解决方案。

给出提示后，Gemini 2.0 闪电思维实验会暂停一下再做出反应，考虑一系列相关提示，并在此过程中解释其推理。一段时间后，该模型会总结出它认为最准确的答案。

事情本该如此。当我问 Gemini 2.0 Flash Thinking Experimental 单词strawberry中有多少个 R 时，它回答两个。

在 o1 发布后，竞争对手人工智能实验室（不仅仅是谷歌）纷纷推出了大量推理模型。11 月初，由量化交易员资助的人工智能研究公司 DeepSeek 发布了其首个推理模型DeepSeek-R1的预览版。同月，阿里巴巴的 Qwen 团队公布了其声称的首个 o1公开挑战者。

彭博社10 月份报道称，谷歌有多个团队正在开发推理模型。The Information 随后在 11 月份的报道中透露，该公司至少有 200 名研究人员专注于这项技术。

是什么打开了推理模型的闸门？首先，就是寻找改进生成式人工智能的新方法。正如媒体最近报道的那样，用于扩展模型的强力技术不再能产生曾经有过的改进效果。

并非所有人都相信推理模型是最佳的发展方向。首先，它们往往价格昂贵，因为运行它们需要大量的计算能力。尽管到目前为止，它们在基准测试中表现良好，但尚不清楚推理模型是否能保持这种进步速度。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴