东京大学医学部的录取通知书,今年差点要发给一个服务器集群。
日本AI创业公司LifePrompt上周公布测试结果:ChatGPT在东京大学、京都大学2025年入学考试中拿下最高分,理科三类医学专业比人类状元还高50分,数学直接满分。一年前,同一套考题它还没过录取线。这个跨度,比复读生逆袭还夸张。
分数拆解:哪里封神,哪里翻车
先看东京大学的成绩单。人文社会类满分550分,ChatGPT考452分;理科三类同样满分550分,它拿503分。两项都超过校方公布的录取最高分——人文类434分,理科类453分。
京都大学更夸张。法学院入学考试771分,超过录取最高分734分;医学院1176分,碾压真人状元的1098分。
但细看科目,AI的偏科暴露无遗。英语得分率90%,世界史论述题却只有25%。
这说明什么?它能啃下标准化答案的硬骨头,却在需要原创观点的开放题上露怯。考试设计的"盲区",恰好是AI能力的"盲区"。
技术迭代:从落榜到状元只用两年
LifePrompt的测试时间线值得玩味。2024年用GPT-4,没过东大录取线;2025年换o1模型,首次合格;现在用ChatGPT 5.2思考模型,直接屠榜。
测试方法也升级了。考题被转化成图像数据输入模型,论述题由日本知名补习学校河合塾的教师人工阅卷——尽量模拟真实考场环境。
「人工智能技术迭代速度极快,企业引入时需要着眼于未来10至20年的业务格局进行布局。」LifePrompt负责人远藤聪这样总结。
但这位负责人的潜台词没说完:如果两年就能从落榜到状元,企业现在的"布局"可能明年就过时。
教授的冷笑话:计算器本来就该比人快
日本人工智能学会会长、庆应义塾大学教授栗原聪的回应,给这场"AI状元"狂欢泼了盆冷水。
「就像计算器的运算速度和精准度远超人类一样,人工智能考出高分本就是理所应当。」
他的核心论点很简单:人类和AI不该放在同一赛道。AI擅长的是海量数据的吸收与归纳,而创造全新价值的能力,人类依旧不可替代。
栗原聪还顺手捅了日本升学制度一刀——侧重考查知识记忆与计算能力的考试模式,已经到了需要改革的时候。
这话听着像给AI高分找台阶,但细想有道理。如果状元考的主要是"记得多、算得快",那AI拿高分确实不算新闻。真正该问的是:这套筛选标准,选出的到底是人才,还是"人形数据库"?
考试设计的尴尬:我们到底在考什么
ChatGPT的世界史论述题得分率25%,这个数字比它的满分数学更有信息量。
论述题本应是区分"会考试"和"会思考"的护城河,但25%的得分率说明,AI至少能凑出点东西——只是质量不够看。如果未来模型把这道坎也跨过去了,考试还能靠什么筛人?
一个可能的走向:标准化考试进一步贬值,面试、作品集、项目制评估权重上升。但这又带来新问题——成本更高,公平性更难保证。
日本顶尖大学的入学考试,某种程度上是东亚应试教育的标杆。AI在这里拿高分,等于给全球教育系统出了一道同步考题:当机器能替代"苦读",教育的核心价值要往哪迁移?
栗原聪说的"创造全新价值",听起来像正确的废话。但看看ChatGPT的25%论述题得分率,至少现在,这句废话还是人类的护城河。
热门跟贴