对不起，我错了，再也不吹AI多么厉害了！

李飞笔记

2024-07-18 22:38 ·河南 ·AI产品经理，AI创业者

首先问大家一个问题：9.8和9.11哪个数字比较大？是不是有点蒙？这不是很明显吗？小学生都知道，9.8啊！那我们来看看号称万能的AI是怎么花式翻车~

事情起因是一档歌手比赛的节目中，选手的比分是13.8分和13.11分，然后就有人说13.11不是比13.8多吗？为什么名次排在13.8的选手后面。

然后评论区就炸锅了，开始谈论到底哪个数字更大。

这时候就有一个会用AI的大聪明，拿这个问题去问AI，结果AI翻车了！

特别是在9.9和9.11这两个数字上，几乎是全军覆没！

哈哈哈哈对不起，我错了，再也不吹AI大模型多么NB了！

我们先来看看国内比较火的Kimi：

结论是9.11大于9.9。

但是它中间还说了，这是个错误答案，正确的比较是0.9大于0.11.

既然你知道错了，为啥还要告诉我一个错误答案？？？？

接下来试试百度的橙篇：

第一次回答是的对，但是它是按$来算的。

我又问了一遍数字9.9和9.11哪个大，他居然还是回答对了。

不敢相信，他居然答对了。

后面我为了方便，直接用Coze调用国内大模型API来测试了一下。

智谱清言-GLM-4 翻车!

阿里-通义千问翻车！

字节-豆包翻车！

最后我们来试试Open AI的GPT：

GPT-3.5 ：回答9.11比9.9大。

GPT-4o：

GPT都翻车了，那没事了！

目前的AI大模型就像一个文科生，目前它的强项是理解和生成自然语言类型的工作，而数学类的问题确实不是AI的强项。让他写写画画还可以，数学题还是别难为它了。

前一段姜萍参加全球数学竞赛有人质疑她是不是使用AI作弊了，现在明白了吧！不可能，因为AI真的也会！

都看到这里了感觉得还不错，随手点个赞、在看、转发三连支持一下吧。

欢迎加入星球！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴