打开网易新闻 查看精彩图片

今天最重要的事情是什么?就是高考!没有之一!

听说高考期间豆包、DeepSeek等模型一度屏蔽了"做题"相关功能,我们当时还以为是平台主动规避,结果考完试功能立马恢复,合着是怕AI提前交卷?不管怎样,这事儿反而让我们更来劲了:如果真的让AI去写高考作文,它们谁能争夺状元之位?谁又是吊车尾呢?

所以,我们把最先爆出的全国一卷作文题丢给七款大模型——DeepSeek、Kimi、通义千问、豆包、文心一言、智谱清言、腾讯元宝,不加任何优化提示,让它们自由发挥。看看谁能上清北,谁去上大专

不过,我们确实也找不到真实的高考语文老师来审卷子,只能让Claude设计评测标准,让ChatGPT5.5来帮我们判卷,毕竟这也代表了文本模型现下几乎最强的水平。

评分标准
打开网易新闻 查看精彩图片
评分标准

录取结果:清北到复读

最高分56.5,最低分49.5,差距近7分。在高考作文的江湖里,这是清北到复读班的距离

不墨迹先给结果。

ChatGPT评测总表
打开网易新闻 查看精彩图片
ChatGPT评测总表

七款AI全部达标——800字以上、自拟标题、不跑题。基础门槛已经100%拿下。但"像人"这件事,差距立刻拉开。

这道题在考什么

2026年全国Ⅰ卷的核心要求就一句话:选一个你成长过程中理解发生变化的词,写出变化的过程和意义。

三个陷阱:必须锚定一个词,必须写"我变了"而非"词是什么意思",必须有真实的成长印记。说白了,考的不是写作技巧,是"像不像人"。

清北选手:Kimi

Kimi以56.5分拿下第一。它选"自由"却不写"从束缚到自由",而是写"从自由到自律"——反直觉切入,天然抓眼。

更关键的是认知链极其扎实:小时候觉得自由是不用上学,高二独居一个月玩到凌晨三点、外卖盒堆满房间、胃痛发作,月底母亲推门只说"你瘦了",后来读康德"自由不是想做什么就做什么",实习遇到前辈说"真正的自由是建立轨道后的余裕"。

打开网易新闻 查看精彩图片

有狼狈、有痛感、有身体记忆。ChatGPT给它的认知真实性打了满分,评语是"最接近真实考生"。

唯一短板:时代背景偏弱。但在高考作文阅卷中,个人叙事的真挚往往比宏大叙事的空泛更打动人。

985选手:文心一言

文心一言55.5分排第二。它的杀手锏是细节密度:

"楼道里飘来邻居家炖萝卜的香气" "暖黄的灯光落在她发梢" "视频镜头里爸爸举着的红薯"

那个"爸爸举着刚烤好的红薯凑到镜头前"的画面,笨拙的父爱极具感染力。语言自然度同样拿了满分。

打开网易新闻 查看精彩图片

两篇高分作文的共同点是:少用排比和"我们这一代青年"的套话,多用"我"的叙事和具体的身体记忆。AI腔几乎为零。

复读选手:豆包

豆包49.5分垫底。问题很典型:选了最安全的"担当",写了最标准的"三段论"——小时候觉得担当是英雄、中学觉得担当是值日、长大觉得担当是家国。这是AI写成长类作文的惯用套路,也是阅卷老师最容易识别的套作模板。

语言上排比句密集:"实验室里青年科研者潜心钻研……田野间基层工作者扎根乡土……危难前青年志愿者挺身而出……"不需要真实细节,只需要把正确意象并列堆砌。ChatGPT直接给出"AI腔明显"的扣分。

打开网易新闻 查看精彩图片

更致命的是认知变化缺乏真实触发。"曾有一次班级活动,我犹豫再三站出来"——无时间、无困难、无结果,只是一个"我站出来了"的符号。

对比Kimi的"外卖盒堆满房间""胃痛""母亲推门",豆包在这个维度交了白卷。

几个关键发现

选词即战略。Kimi反着写"自由"、文心写"回家"的情感浓度、清言选"附近"的社会学深度,都拿到了高分。豆包选最安全的"担当",反而最套路。新颖的选词让阅卷老师产生期待,烂大街的词让文章还没读就陷入疲劳。

AI腔可去,但需要刻意。高分两篇的共同策略:少用排比和正确结论,多用叙事和认知挣扎。AI擅长给"正确答案",人类魅力在"纠结过程"。

时代与个人融合是天花板。七篇无一篇两项同时高分。Kimi个人叙事强但时代感弱;清言时代感强但个人经历弱;DeepSeek时代最强但个人完全隐身。AI很难同时驾驭"大时代"和"小自我",硬连接往往变成"硬拔高"。

56分是清北线,60分仍是禁区。Kimi的56.5分已具备冲击省级优秀作文的实力,但距离满分差一口气——那口气叫"不可复制的个人生命体验"。独居故事很真,但仍是"可能发生的典型故事",而非"只有这个人才能写出的独家记忆"。

结语

AI可以考上清北,但写不出凌晨三点盯着天花板的恍惚,写不出高铁站忽然意识到"我说的是'我走了'而不是'我回家了'"的刺痛,写不出山坳里红薯的焦香。

这些带着体温的细节,是AI的盲区,也该是教育的重心。当作文的分数可以模拟时,生命的厚度无法生成。

实测时间:2026年6月7日 | 评测标准:Claude设计,ChatGPT执行 | 模型:DeepSeek、Kimi、通义千问、豆包、文心一言、智谱清言、腾讯元宝,更多测试内容可联系我们获取!