中国日报12月22日电 12月14日-15日,第七届世界教育前沿论坛在深圳举行。本届论坛的主题为"测评与考试:从科举到人工智能",来自英国、韩国、马来西亚、新加坡及中国内地、香港、台湾的三十余位专家学者以及一线教育工作者,围绕主题分享思考,积极提出改变现状的路径和方法。

重新审视当前教育:突破传统测评和考试

世界教育前沿论坛主席 、香港大学荣休教授、中国教育三十人论坛成员程介明谈到,今天的全民学校制度,是不到200年前工业社会顶峰时期的产物,目的是为社会提供各类各层的人力资源,其形态模拟了工业生产流程,考试成了质量控制的关键。

传统教育体系通常基于年龄对学生进行分级,测试和评估也遵循这一年龄分级体系,忽视了人与人之间不同的能力、动机和兴趣等。

程介明表示,随着社会变迁,大规模生产逐渐不再是常态,机器替代人工成为趋势,就业形态发生了变化,转工转行成为常态,自雇职业受到羡慕。年轻人面临的前途多变,生涯规划变得不确定。传统的应试教育制度可能不再适用,社会需要培养自信、自立、自主、自为的个体。教育改革应注重培养学生的能动性和自主性,将学习还给学生,让他们掌握自己的学习。人工智能为教育改革提供了新的机会,通过提供各种工具,让学生掌握自己的学习,并不同程度地尝试突破传统的测评和考试。

台湾新竹清华大学教授谢小芩回顾了科举制度的历史、特点以及其与现代教育的联系。科举制度不仅影响了教育,还对社会流动产生了深远的影响。她谈到,考试主导教学的现象可以通过人工智能的发展得到改进,从而提升考试和测评方式,推动养成教育和教学的整体提升。例如,可以使用AI来出题、进行追问式和情境式考试,以及提高考试的效度和公平性。

亚洲学生在学科学习上的投入是显而易见的,尤其是在数学和科学等科目上,他们的表现往往在全球范围内都非常出色。然而,尽管亚洲学生在国际学术竞赛和标准化考试中取得了优异成绩,但在诺贝尔奖等国际荣誉的获得上,欧美国家确实更为突出。这也促使教育界和公众开始思考,传统的测评方法是否能够全面反映学生的多元智慧和能力。

经济合作组织(OECD)教育与技能司司长、"PISA之父"安德烈亚斯·施莱歇尔谈到,培养一流的人才,需要深入思考如何增强个人在阅读、数学和科学等方面的能力,以适应不断数字化的社会。

安德烈亚斯·施莱歇尔介绍,最新(2022年)的PISA测评结果显示,近60%的学生完成了近60%的阅读任务,以及略超过一半的数学任务。当人工智能ChatGPT参与解决这些问题时,它在阅读方面表现得比15岁学生好,但在数学方面学生的成绩仍领先。然而,人工智能的数学能力进步迅速,并很快赶上15岁学生的水平。

安德烈亚斯·施莱歇尔介绍,日本在PISA评估中虽然在阅读、数学和科学方面获得了满分,但这只是表面现象。深入探究后,发现日本学生在心理健康、个人归属感、认同感发展方面存在局限性,缺乏快乐感和自主性。美国学生在阅读、数学和科学方面表现不佳,但他们有很强的参与度和自主性,能够采取行动,但在情感韧性和适应变化能力方面有所不足。丹麦在教育体系中的表现全面,学生在学术、快乐感、归属感、自主性、参与度和情感韧性方面都表现出色,他们积极参与学校活动,能够自我组织生活,并对多元思维方式持开放态度。

"这些例子表明,成功的教育体系需要从多角度评估,不仅关注学术成绩,还要关注学生的全面发展。"

他认为,评估固定学科内容比评估思维能力容易,但我们需要改变评估方式。常规认知技能的需求正在下降,技术密集型任务在增加,我们需要将人工智能融入其中。他强调,学校应该帮助学生理解他们的存在意义、价值观、热爱的事物以及他们想要实现的目标,这需要个性化的教育方法。同时,学习和考试不应该被割裂开来,考试应该成为学习体验的一部分,并提供持续的反馈。

教育测评的全球视野:技术与评估的革新

依托大数据分析、机器学习、自然语言处理等先进技术,全球范围内,教育评价正从传统的纸笔考试模式,向着智能化、个性化和全球化的方向迈进。论坛上,嘉宾们分享各自在这一领域的探索和实践,为教育评价改革提供了宝贵的经验和启示。

韩国江原大学副教授申铁均在论坛上分享了韩国在2013年开始施行的"免考试学期"计划。这一项目是为了克服韩国填鸭式教育、标准化考试制度、低学习动机和过度竞争等问题。新加坡国立南洋理工大学国立教育学院吴伟斌副教授谈到新加坡减少考试的尝试与经验。科大讯飞副总裁周佳峰在论坛上介绍了通过测评去推动教育的实践经验。马来西亚董总教育研究与发展组研究员胡依珊强调了多元化课程设计的重要性,以应对应试教育的局限性。

创新教育测评:跨学科实践与教学改革

传统的测评方法往往侧重于学生的学术成绩和知识掌握程度,而较少关注学生的创造力、批判性思维、情感智慧、社交技能等非认知能力。在本次大会上,来自教学一线的校长和老师们进行了分享。他们均认为,教育评估的改革方向之一是更加全面地评估学生的多元智慧和能力。

江苏海门新教育小学二年级语文老师兼班主任盛美在圆桌论坛上分享了自己班级在写绘作业评价方面的实践。盛美采用了对作业"少介入、不批、不改、只赏"的评价方式,通过留下充满情感的符号来鼓励学生。这种方式不仅减少了教师的批改负担,还培养了学生自主修改的意识。此外,盛美所在的班级还采用"多展示"和"群眼光"的评价策略,通过小组分享、全班展示和网络平台分享学生作品,以及让学生互相评价,以营造积极的学习氛围。

"我的能力已不足以批改学生利用AI生成的作品。"香港圣公会阮郑梦芹银禧小学副校长李伟铭分享了一个案例,该校六年级学生根据二年级学生创作的故事进行阅读理解,并利用AI技术生成图片。这一过程中,六年级学生通过阅读低年级学生的作品,不仅进行了有趣的讨论和反思,还制作了令人惊叹的作品。李伟铭认为,AI时代要求教师重新思考批改的目的和方向,从简单的理解、牢记转向更高层次的创作。教师不再是权威的知识传授者,而是知识的共享者和引导者,与学生一起学习和反思。教师需要思考如何在班级中发挥新角色,如何赋能学生,鼓励他们互相评论、评审和评赏,以促进学生的进步。这是新一代学习的关键。

深圳市宝安中学(集团)校长袁卫星在论坛上介绍了一些好的测评案例。比如有学校将传统的考试转变为趣味的综合素养测评。学生们在设计文创产品的中,不仅学习美术设计,还要进行项目推销、文化研究、材料采购和产品制作,最终以产品发布会的形式向虚拟客户推销自己的作品。这种跨学科融合的测评方式,强调实践操作和创造力,让学生在参与中学习。袁卫星认为,教育测评的原则应基于需求,以学生为中心,根据学生的感受调整测评的频率和难度,真正体现学生为主体、教师为主导的教学理念。

AI在教育测评中的挑战

AI为教育测评提供了更为高效和个性化学习的机会,全球范围内不同学校也纷纷探索,但这也带来了一系列技术和伦理挑战,如确保测评结果的公平性、处理技术故障等问题。

湖南师范大学教授杨志明曾使用ChatGPT写了一篇关于"创新人才培养"的八股文,按照高考作文满分60分的标准,13位专家给出的分数为49分。而ChatGPT给自己写的这篇文章打了54分。特别是科大讯飞,直接给出了满分。

杨志明在论坛上介绍,在比较ChatGPT与人类在逻辑推理、假设辨认、演绎推理、整合诠释和论证评价五个维度的表现时,学生仅仅在逻辑推理上比ChatGPT表现略好,在其它四个维度上能力上则不如ChatGPT。

杨志明谈到,AI的发展带来了许多机遇,例如通过自然语言处理技术,人们可以直接用自然语言进行学习和交流。"在目前的AI技术水平下,AI可以作为助手,但还不能完全担任主角,因为这样做可能会带来较大的风险,就像现在没有人敢完全依赖AI开出的药方一样。" 杨志明提出,尽管ChatGPT带来了许多机遇,但也伴随着风险。例如,AI可能存在数据偏见,导致考试题目对某些文化或种族存在不公平。

伦敦大学学院教育与社会学院教授韦恩·霍姆斯从批判性的视角谈到,在教育领域引入人工智能工具时,一个关键问题是缺乏独立证据来验证这些工具的安全性、有效性和对课堂的积极影响。虽然这些工具可能已经经过某些测试,并声称具备有效性和安全性,但实际上缺乏独立证据来支持这些说法。这导致教育决策者、教师和学校领导在选择和使用这些工具时,往往依赖不确定的信息。

他指出,这种情况可能导致孩子们成为未经充分控制的实验对象,这与科学实验应在良好道德控制下进行的原则相违背。韦恩•霍姆斯建议将人工智能工具的使用从无根据的尝试转变为基于充分证据的技术应用。这要求我们推动对人工智能工具进行深入的研究和评估,以建立坚实的证据基础,从而确保对这些工具的有效性和安全性有信心,并确保它们对教育产生积极影响。

据悉,论坛由中国教育三十人论坛、香港大学教育政策研究中心、田家炳基金会、深圳香港培侨书院龙华信义学校联合筹办。

来源:中国日报网