首先问大家一个问题:9.8和9.11哪个数字比较大? 是不是有点蒙?这不是很明显吗? 小学生都知道,9.8啊! 那我们来看看号称万能的AI是怎么花式翻车~

事情起因是一档歌手比赛的节目中,选手的比分是13.8分和13.11分,然后就有人说13.11不是比13.8多吗?为什么名次排在13.8的选手后面。

然后评论区就炸锅了,开始谈论到底哪个数字更大。

这时候就有一个会用AI的大聪明,拿这个问题去问AI,结果AI翻车了!

特别是在9.9和9.11这两个数字上,几乎是全军覆没!

哈哈哈哈 对不起,我错了,再也不吹AI大模型多么NB了!

我们先来看看国内比较火的Kimi:

结论是9.11大于9.9。

但是它中间还说了,这是个错误答案,正确的比较是0.9大于0.11.

既然你知道错了,为啥还要告诉我一个错误答案????

接下来试试百度的橙篇:

第一次回答是的对,但是它是按$来算的。

我又问了一遍数字9.9和9.11哪个大,他居然还是回答对了。

不敢相信,他居然答对了。

后面我为了方便,直接用Coze调用国内大模型API来测试了一下。

智谱清言-GLM-4 翻车!

阿里-通义千问 翻车!

字节-豆包 翻车!

最后我们来试试Open AI的GPT:

GPT-3.5 :回答9.11比9.9大。

GPT-4o:

GPT都翻车了,那没事了!

目前的AI大模型就像一个文科生,目前它的强项是理解和生成自然语言类型的工作,而数学类的问题确实不是AI的强项。让他写写画画还可以,数学题还是别难为它了。

前一段姜萍参加全球数学竞赛有人质疑她是不是使用AI作弊了,现在明白了吧!不可能,因为AI真的也会!

都看到这里了感觉得还不错,随手点个赞、在看、转发三连支持一下吧。

欢迎加入星球!