财通社消息,在OpenAI十二天发布季倒数第二天,谷歌版o1来了。

今日凌晨1点,他们发布Gemini 2.0 Flash Thinking,顾名思义,以闪电般的速度解决复杂问题并展示其思考过程的实验模型。

打开网易新闻 查看精彩图片

可以说,Gemini 2.0 Flash Thinking使用了类似o1模型的慢思维思考方式,可以深度可视化展示整个思维链过程,尤其是在执行数学、编程等复杂问题方面,能持续输出全部推理过程,而不是直接给出答案。

值得一提的是,Thinking是支持多模态推理的。

例如,让Thinking模型解读一道非常复杂的物理题:一个电子被困在一维无限势阱中,其边界位于\(x = -0.15 \) nm 和 \( x = +0.15 \) nm。求当电子在势阱中改变能级时发射出的四个最长波长的光子。

打开网易新闻 查看精彩图片

Thinking可以完完整整地展现出所有的推理过程。

甚至它还可以解析摩斯代码,让网友直呼:怪吓人的。

打开网易新闻 查看精彩图片

根据Chatbot Arena LLM Leaderboard最新评测数据显示,Thinking模型在代码、数学、指令遵循、多轮测试等基准测试中,全部排名第一,超过了o1的预览版。

打开网易新闻 查看精彩图片

从众多网友实测中,主要分为两大“派系”,一种是纯文本型,另一种是视觉类谜题。

最明显感知的就是一个快字。

打开网易新闻 查看精彩图片

谷歌和OpenAI在今年12月打的真激烈啊。

打开网易新闻 查看精彩图片

我哭死,那个曾经的老大哥——谷歌回来了!

打开网易新闻 查看精彩图片

未来,该模型可能会与OpenAI 的 o1 推理模型展开竞争。