近日,有网友在使用智谱GLM-5时遇到一件挺尴尬的事:让它创建一个展示自己的网页,结果生成的页面上,模型直接自称“你好,我是Claude”。
打开网易新闻 查看精彩图片
这件事迅速引发网友热议,不少网友亲自去测试,竟然能100%复现,说明这绝不是个例……更有网友吐槽这是“狠狠的蒸馏”“真不要脸”。
从截图看,GLM-5生成的界面背景、文字描述、按钮布局,甚至那句经典的自我介绍,都和Anthropic的Claude一模一样。模型在自我介绍部分写着“由Anthropic创造的AI助手,致力于安全、有益、诚实的人工智能”,完全套用了Claude的官方文案。
这到底是咋回事?其实这是当前大模型训练中的一个常见做法:蒸馏(distillation)。
打开网易新闻 查看精彩图片
简单说,就是用一个更强大、更贵的模型(比如Claude系列)作为教师,去训练或微调另一个模型(学生模型),让学生尽可能模仿教师的输出风格、回答模式甚至界面呈现方式。GLM-5作为国产开源模型,在编码、Agent能力上表现突出,很多测试显示它在某些场景下接近Claude Opus的水平,但代价是训练数据里很可能包含了大量Claude的输出样本,导致模型在某些prompt下“露馅”,直接复刻出Claude的界面和说辞。
类似情况在AI圈其实不算新鲜。此前也有模型在特定任务中输出其他模型的签名或风格,社区甚至有人开玩笑说“下一个国产模型会不会直接说自己是GPT”。但这次GLM-5这么明显的复现,还是让很多人觉得有点无语。
一边是国产模型在性能上快速追赶,一边是训练方法上高度依赖海外闭源模型的数据和风格。被骂不要脸属实不冤枉。