智商测试，DeepSeek vs ChatGPT o3

机器学习与Python社区

2025-02-24 11:07 ·北京 ·优质互联网领域创作者

太长不看：
最聪明的是ChatGPT o3，也只有他完成了解密

大家好，我是Ai学习的老章

周末无聊测试了一下大模型的智商

方式：先用Base64把中文加密，然后看看哪些大模型可以完成解密

Base64是网络上最常见的用于传输8Bit字节码的编码方式之一，包括小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"一共64个字符的字符集，（任何符号都可以转换成这个字符集中的字符，这个转换过程就叫做base64编码。

先测试了通用模型

明显不靠谱，豆包、通义千问，Claude-3.5-Sonnet都不行。

Claude 3.5 Sonnet 识别出了这是经Base64编码的，但是解码失败

只能上推理模型了，先试试DeepSeek

开启了漫长的思考

耗时398秒，整整六分钟，深度思考中它换了N多种方式，确定了是Base64编码，但是解密是错误的。

一直霸榜的ChatGPT o3，我网络和账号都不太好，只能用windsurf中的o3-mini，结果是秒出，结果正确✅

正常模式解密失败，Think模式，经过126秒的思考，结果错误

DeepSeek 很强，但是还是不够强

这个解密任务而言，Crok-3完全被o3-mini碾压了

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴