太长不看:
最聪明的是ChatGPT o3,也只有他完成了解密

大家好,我是Ai学习的老章

周末无聊测试了一下大模型的智商

方式:先用Base64把中文加密,然后看看哪些大模型可以完成解密

Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,包括小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"一共64个字符的字符集,(任何符号都可以转换成这个字符集中的字符,这个转换过程就叫做base64编码。

先测试了通用模型

明显不靠谱,豆包、通义千问,Claude-3.5-Sonnet都不行。

Claude 3.5 Sonnet 识别出了这是经Base64编码的,但是解码失败

只能上推理模型了,先试试DeepSeek

开启了漫长的思考

耗时398秒,整整六分钟,深度思考中它换了N多种方式,确定了是Base64编码,但是解密是错误的。

一直霸榜的ChatGPT o3,我网络和账号都不太好,只能用windsurf中的o3-mini,结果是秒出,结果正确✅

正常模式解密失败,Think模式,经过126秒的思考,结果错误

DeepSeek 很强,但是还是不够强

这个解密任务而言,Crok-3完全被o3-mini碾压了