ChatGPT考赢日本状元，但教授说这不算数

全栈遛狗员

2026-04-27 20:58 ·北京

东京大学医学部的录取通知书，今年差点要发给一个服务器集群。

日本AI创业公司LifePrompt上周公布测试结果：ChatGPT在东京大学、京都大学2025年入学考试中拿下最高分，理科三类医学专业比人类状元还高50分，数学直接满分。一年前，同一套考题它还没过录取线。这个跨度，比复读生逆袭还夸张。

分数拆解：哪里封神，哪里翻车

先看东京大学的成绩单。人文社会类满分550分，ChatGPT考452分；理科三类同样满分550分，它拿503分。两项都超过校方公布的录取最高分——人文类434分，理科类453分。

京都大学更夸张。法学院入学考试771分，超过录取最高分734分；医学院1176分，碾压真人状元的1098分。

但细看科目，AI的偏科暴露无遗。英语得分率90%，世界史论述题却只有25%。

这说明什么？它能啃下标准化答案的硬骨头，却在需要原创观点的开放题上露怯。考试设计的"盲区"，恰好是AI能力的"盲区"。

技术迭代：从落榜到状元只用两年

LifePrompt的测试时间线值得玩味。2024年用GPT-4，没过东大录取线；2025年换o1模型，首次合格；现在用ChatGPT 5.2思考模型，直接屠榜。

测试方法也升级了。考题被转化成图像数据输入模型，论述题由日本知名补习学校河合塾的教师人工阅卷——尽量模拟真实考场环境。

「人工智能技术迭代速度极快，企业引入时需要着眼于未来10至20年的业务格局进行布局。」LifePrompt负责人远藤聪这样总结。

但这位负责人的潜台词没说完：如果两年就能从落榜到状元，企业现在的"布局"可能明年就过时。

教授的冷笑话：计算器本来就该比人快

日本人工智能学会会长、庆应义塾大学教授栗原聪的回应，给这场"AI状元"狂欢泼了盆冷水。

「就像计算器的运算速度和精准度远超人类一样，人工智能考出高分本就是理所应当。」

他的核心论点很简单：人类和AI不该放在同一赛道。AI擅长的是海量数据的吸收与归纳，而创造全新价值的能力，人类依旧不可替代。

栗原聪还顺手捅了日本升学制度一刀——侧重考查知识记忆与计算能力的考试模式，已经到了需要改革的时候。

这话听着像给AI高分找台阶，但细想有道理。如果状元考的主要是"记得多、算得快"，那AI拿高分确实不算新闻。真正该问的是：这套筛选标准，选出的到底是人才，还是"人形数据库"？

考试设计的尴尬：我们到底在考什么

ChatGPT的世界史论述题得分率25%，这个数字比它的满分数学更有信息量。

论述题本应是区分"会考试"和"会思考"的护城河，但25%的得分率说明，AI至少能凑出点东西——只是质量不够看。如果未来模型把这道坎也跨过去了，考试还能靠什么筛人？

一个可能的走向：标准化考试进一步贬值，面试、作品集、项目制评估权重上升。但这又带来新问题——成本更高，公平性更难保证。

日本顶尖大学的入学考试，某种程度上是东亚应试教育的标杆。AI在这里拿高分，等于给全球教育系统出了一道同步考题：当机器能替代"苦读"，教育的核心价值要往哪迁移？

栗原聪说的"创造全新价值"，听起来像正确的废话。但看看ChatGPT的25%论述题得分率，至少现在，这句废话还是人类的护城河。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴