作者|袁博
来源|AI先锋官
9.11和9.8哪个大?最近这个小学问题可是把大模型们难住了。
还有网友向AI大模型问了这个问题,更更更抽象的就来了,大模型居然答错了!
小编也是非常好奇都有哪些大模型会回答错误呢,所以对当前主流的大模型都测试了一遍,看看都有谁露怯了吧。
ChatGPT
回答错误❌
文心一言
回答正确✓
Kimi
回答错误❌
豆包
回答正确√
360智脑
回答正确√
百川智能
回答错误❌
通义千问
回答正确√
讯飞星火
回答正确√
腾讯元宝
回答正确√
商汤商量
回答错误❌
智谱清言
回答正确√
天工AI
回答正确√
其中,ChatGPT、Kimi、百川智能、商汤商量回答错误,它们认为对于9.11,小数点后第一位是1,第二位是1;而对于9.8,小数点后第一位是8,没有第二位数字。根据小数的比较规则,从小数点后第一位开始比较,直到可以判断出大小为止。
在小数点后第一位,9.11的1小于9.8的8,但是由于9.8没有第二位数字,而9.11的第二位数字是1,其值更大。因此,它们得出结论:9.11大于9.8。
看似合理的解释,但实际上却犯了常识性错误。
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
热门跟贴