模型升级的浪潮从未停歇,但一个反直觉的现象正在ChatGPT用户群中蔓延:新模型跑分越来越高,反应越来越快,弹窗里弹出的最新版本号让人应接不暇,可闲聊社群里反复出现的,却是对一款即将停产的旧模型的告别声。6月27日,GPT-4.5将从ChatGPT的模型选择菜单中彻底消失,紧随其后的o3也将在8月26日迎来同样的命运。这是OpenAI一次安静的清扫,发布说明里只有一句平淡的解释:“为了更好服务于更新、更强的模型,我们正继续淘汰ChatGPT中使用量有限的旧模型。”
没有倒计时海报,也没有致用户的感谢信。但X平台上名叫Striver的用户敲下的一句话,却像一簇被引燃的情绪:“直到今天,4.5依然是最好的写作模型。o3是一个原生化了的纯粹推理模型。5系列仍然无法匹配这两者各自擅长的东西。”这番话迅速获得了共鸣,不是因为技术分析有多深奥,而是它说出了一种普遍的困惑:为什么在推理测评榜单上大幅领先的后继者,到了真实的手感里,反而让人觉得少了点什么。
这种手感上的落差,早在GPT-4o被GPT-5顶替时就剧烈爆发过一次。当时OpenAI按照更新节奏将4o移出选项,结果遭遇了规模惊人的用户反对声浪,以至于公司不得不在限定时段内重新上线4o,直到GPT-5经过打磨提升后才彻底把它拿走。那一场风波已经暗示了一个正在形成的趋势:对于许多人来说,选择模型不再只是一项纯粹的效能比较,而开始掺杂进难以量化的熟悉感和创作默契。技术媒体人Eric Hal Schwartz在最近的体验中更直接地发现,聊天机器人的“个性”对于偏好的影响力,几乎压倒了基准测试里那些遥不可及的数字。
GPT-4.5的退役,同时意味着ChatGPT内部不再保留任何冠以“GPT-4”之名的模型。这是一个时代的正式封箱。回看GPT-4初登场的那段日子,它用一纸论文、一场考试、一段即兴的图像分析,就把数百万人的认知从“AI是未来展品”扭转为“AI已经坐进了我的书房”。它写申请文书、通过执业资格考试、搭出可运行的应用、对着照片讲出隐藏的视觉幽默。在它面前,人们第一次产生了面对一个“真正有智识感”的黑箱的兴奋和不安。那种感觉,并不是后来的多模态融合或者更长的上下文窗口可以轻易复制的。
如今当人们在论坛上争论GPT-4、GPT-4o、GPT-5以及新一代推理模型孰优孰劣时,讨论的坐标系已经悄悄偏离了基准面板。比起能不能答对数学题,越来越多的人关心的是哪个模型能在三次提示之内写出想要的那句话,哪个模型会在深夜的对话里给出不过度光滑的回应。OpenAI显然将重注压在了性能的不可逆进化上,它相信GPT-5.5等继任者全面接管之后,很少有人会持续回望GPT-4.5。但GPT-4o退役前的激烈反弹,已经给出了另一套答案:用户与特定模型之间正在结成本不该属于软件的依恋。
八年前Meta曾有过万亿参数规模的实验模型,但那时的AI没有走进大众的日常叙事。GPT-4系列之所以值得被记住,恰恰在于它把参数世界的震荡传递到了普通人的指尖上。现在,当这个系列的最后一块拼图被摘除,一个也许更深层的问题浮了出来:模型越来越“能干”的进程中,是否无意间磨损了某些让机器显得更贴近人类的杂质?OpenAI的发布说明里写的是“更好服务”,但用户留言区里反复敲打的,更像是一种对于旧智能气质的命名渴望。
热门跟贴