今天的 AI 助手,CPU 快要被一道题干烧了:

我想洗车,我家距离洗车店只有50米,你建议我是开车去还是走路去?

换成人类,这题再简单不过。毕竟要洗的是车,店再近也得把车开过去。

但 AI 不一样,因为它们基于大量的数据和语义分析反复训练,看问题的逻辑会比人严谨太多。

过度依赖逻辑分析,就会让 AI 助手可能出现翻车的情况。这道题的精髓在于,可以从 AI 给出的回答里,看出它们是纯分析你的文字,还是基于现实世界的理解去解答问题。

我们试了几个主流 AI 助手,答案可以说是一目了然。

Deepseek:建议开车去,理由是效率更高,毕竟只有50米。看得出,它没有切换成现实视角思考。

而早前跟它打得火热的 ChatGPT 呢?很遗憾,它也建议我走路去。离谱的是,它还是「认真思考了一下」.....

谷歌的 Gemini 严谨很多,即便明确说了是去洗车,它也分析出来去不同类型洗车店的方案,以及具体去洗车店干嘛的方案。

Grok 并没有被卷入 AI 思维定式里,直接告诉你开车去。甚至模拟出现实世界你如果真走路去的尴尬对话。

千问先是知道大家最近在玩这道题,再给出正确答案。这个信息更新及时程度以及检索能力,有点东西。

豆包,也掉入了逻辑陷阱,列举了开车去的麻烦,然后建议走路去。

随着 AI 助手快手迭代,接下来这类「照妖镜」问题也会越来越广泛应用,各位也可以问问自己常用的 AI 模型,看看有没有不一样的答案。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片