作者|袁博

来源|AI先锋官

9.11和9.8哪个大?最近这个小学问题可是把大模型们难住了。

。
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

还有网友向AI大模型问了这个问题,更更更抽象的就来了,大模型居然答错了!

小编也是非常好奇都有哪些大模型会回答错误呢,所以对当前主流的大模型都测试了一遍,看看都有谁露怯了吧。

ChatGPT

打开网易新闻 查看精彩图片

回答错误❌

文心一言

打开网易新闻 查看精彩图片

回答正确✓

Kimi

打开网易新闻 查看精彩图片

回答错误❌

豆包

打开网易新闻 查看精彩图片

回答正确√

360智脑

打开网易新闻 查看精彩图片

回答正确√

百川智能

打开网易新闻 查看精彩图片

回答错误❌

通义千问

打开网易新闻 查看精彩图片

回答正确√

讯飞星火

打开网易新闻 查看精彩图片

回答正确√

腾讯元宝

打开网易新闻 查看精彩图片

回答正确√

商汤商量

打开网易新闻 查看精彩图片

回答错误❌

智谱清言

打开网易新闻 查看精彩图片

回答正确√

天工AI

打开网易新闻 查看精彩图片

回答正确√

其中,ChatGPT、Kimi、百川智能、商汤商量回答错误,它们认为对于9.11,小数点后第一位是1,第二位是1;而对于9.8,小数点后第一位是8,没有第二位数字。根据小数的比较规则,从小数点后第一位开始比较,直到可以判断出大小为止。

在小数点后第一位,9.11的1小于9.8的8,但是由于9.8没有第二位数字,而9.11的第二位数字是1,其值更大。因此,它们得出结论:9.11大于9.8。

看似合理的解释,但实际上却犯了常识性错误。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾