打开网易新闻 查看精彩图片

新智元报道

编辑:桃子

【新智元导读】完整版o1图像理解能力,被提前「放出」了?网友曝出o1能够识图,进行推理总结。现在,o1多模态一大波试用已经铺屏全网。

o1图像理解,可用了?!

打开网易新闻 查看精彩图片

一大早,网友们纷纷晒出,自己获得了o1图像理解新功能。一大波测试,简直惊掉下巴。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

小编测试了下,确实可用。仅需在模型选项中,选择ChatGPT 4o mini(非绝对),上传图片就可以了。

打开网易新闻 查看精彩图片

还有人解释了下原理,这一功能没有定向模型,有时还会切换。

打开网易新闻 查看精彩图片

几天前,OpenAI伦敦开发者日上,,其中就包括:

函数调用、开发者message、流式传输、结构化输出、图像理解。

打开网易新闻 查看精彩图片

据称,这并非官方发布,可能是OpenAI底层微服务崩溃了,还没来得及修补。因为它本来打算作为内部私有服务使用。

打开网易新闻 查看精彩图片

先不管啥原因,直接用就完了。

现在,一大波o1图像理解测试,已经全网刷屏了。

打开网易新闻 查看精彩图片

o1最强图像理解,「解禁」了

自称是获得o1图像理解第一人,分享的一张聊天截图,让模型去分析。

o1解释道,「图片是聊天对话的截图,可以看到名为Bing的Al发送的两条信息」。

打开网易新闻 查看精彩图片

经过一番测试,他认为这就是完整版o1。

打开网易新闻 查看精彩图片

大咖歸藏(guizang.ai)用高中奥数测试一番,发现o1竟然答对了。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

另一个有趣的案例。

打开网易新闻 查看精彩图片

 o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%
打开网易新闻 查看更多视频
o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%

一位网友表示,o1图像理解的推理速度,简直让人难以置信。

比如,分析一张海底光纤通信电缆地图,它通过多步思考准确给出,这些电缆横跨大洋,连接着世界上不同的大陆和地区。

打开网易新闻 查看精彩图片

不过遗憾的是,它还没有完全做好超越图像,实现全多模态理解的准备。

比如,网友上传了一个mp4视频,o1还无法读取。

打开网易新闻 查看精彩图片

还有网友直接给o1上了推理图形题,经过48秒的思考,最终给出了解答。

打开网易新闻 查看精彩图片

描述图片是什么,o1给出了一个完美解释。

打开网易新闻 查看精彩图片

再让它分析一张南瓜灯的图片,也准确答出了。

打开网易新闻 查看精彩图片

在另外一些简单视觉难题上,o1还是有困难。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

推理新工具

除了图像理解能力,o1还新增了一个「Reasoning」新工具。

网友发现,在4o+canvas在,点击/就可以唤醒工具栏菜单,其中就包含了这个推理新工具。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

不过需要注意的是,这个工具使用要通过以下的步骤:

打开网易新闻 查看精彩图片

- 在4o+canvas中附加文档

- 不要通过下拉菜单切换到o1-preview,否则会清除文件

- 输入/reson

- 按回车键

o2在研究生级别基准取得105%分?

更具玩味的是,Sam Altman还出来恶搞。

他发文表示,我听说,o2已经在GPQA上取得105%的成绩。(注意是小写字母)

打开网易新闻 查看精彩图片

紧接着,事情又来了反转,他表示算错了。要说这波营销,还的是奥特曼本尊。

打开网易新闻 查看精彩图片

评论区的网友纷纷追问道,o2什么时候放出?还有的人认为,OpenAI的更新实在是太慢了,早已急不可待。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

不过,近日OpenAI的战略营销主管在采访中介绍了,OpenAI的步伐和品发布时间表正在加快。

这么看来,相较于以前,确实加速了不少。

打开网易新闻 查看精彩图片

参考资料:

https://x.com/ananayarora/status/1852666259478835458