人工智能没有显著提高作弊行为
去年春天,Turnitin(一家提供反作弊工具,检测学生论文中人工智能使用情况的公司),发布了基于其软件审查的两亿多个样本研究结果。其中,百分之三的论文几乎完全由人工智能撰写,大约百分之十的论文,呈现出使用人工智能的一些痕迹。这些数字表明作弊现象并不显著。其他研究表明,自从 ChatGPT 等大型语言模型的出和大规模普及以来,学生抄袭现象并没有明显增加。
然而越来越多的老师和成年人似乎相信孩子都会作弊。美国民主与技术中心的一项研究发现,“大多数教师仍然表示,生成式人工智能让他们更加怀疑学生的作业,是否真的是他们自己完成的。” 当前,许多学区未能实施明确而全面的人工智能政策,教育工作者之间就如何处理涉嫌作弊的情况,展开了另一层辩论。堪萨斯大学卓越教学中心最近发布了一套 Turnitin 使用指南,警告教师不要根据该公司的软件做出“快速判断”,并建议教育工作者“多采取一些步骤”收集信息”,包括比较学生以前的作业示例、提供第二次机会以及与学生交谈。
我认为在使用 ChatGPT 的学校中,正在发生这样的事情:老师可能对学生有点过度怀疑,部分原因是他们被给予了检测作弊者的工具。这些能够检测作弊的工具,可能直接吓坏了一些学生,但作弊者还是会作弊。
当我在美国上高中时,图形计算器被指责为学生作弊的罪魁祸首。十年后,手机在教室中的普及,激起了孩子们在老师一转身时就互相发短信发送考试答案的景象。维基百科也曾一度成为学校研究和知识的破坏者。如今,维基百科显然已经成为社会的利好工具,它可能比其所取代的大英百科全书更准确、更少偏见。
这种情况让我想起了体育博彩应用程序的问题。赌博和剽窃一样,并不是什么新鲜事。如果你把一百个一生中从未下过赌注的人关在赌场里,他们中的一小部分人会在第二天、第三天、第三天回来。其余的人要么不再下注,要么只是偶尔以负责任的方式赌博。
在我看来,学校作弊是一种类似的现象——也许大多数孩子确实会做一些不守规则的功课,但有些孩子永远不会,而且更多的孩子可能只会在最琐碎(或最困难的)情况下才会这样做。
技术改变了作弊边界
技术确实改变了体验;它可以鼓励极端情况下,人们开始在掷骰子桌上掷骰子或要求 ChatGPT 写一篇论文。但是,在大多数情况下,这并不是成年人在体育运动中赌博或孩子在学校作弊的原因。正如维基百科没有破坏书面文字一样,并且可能通过简化了解某个主题的介绍性任务,来加深许多学生论文的研究——核心文章将在大型语言模型中幸存下来。
急于解决人工智能作弊问题,以及开发并销售给全国各地学校的无数教育工具,引发了一个比书面文字能否生存更有趣的第三个问题。当我们思考学生的作业时,我们如何在他们发展中的思维中产生的东西和没有产生的东西之间划清界限?
在STEM科目中,界限更加清晰一些。如果一个学生只是偷偷地看着同桌并写下相同的答案,大多数人都会认为这是作弊。但是,如果一个学生试图证明他理解如何解决涉及乘法的复杂数学问题,那么使用计算器是否意味着该学生在作弊?他并不是在测试是否知道如何乘法,那么为什么要浪费时间并可能引入粗心的错误呢?
我不认为用 ChatGPT 写论文与使用计算器在更大的数学问题中完成更琐碎和基本的任务是一回事,但值得一问的是,为什么我们对研究的自动化和书面文字有不同的感觉。即使在美术领域,赞助人和鉴赏者也早已接受这样的观点:艺术家不需要实际表演每一笔,建造每一个雕塑,或者建造大型装置的每一个部分。一小群未署名的助手涉足了安迪·沃霍尔、达米恩·赫斯特和杰夫·昆斯的作品,这不时引发争议,但还不足以结束这种做法。如果一台机器完成了助手的所有工作,我们会不会对这些艺术家产生轻视?
这些问题是抽象和荒谬的,但它们也反映了我们思考什么构成作弊、什么不构成作弊的任意方式。除了公然抄袭行为之外,人文学科中作弊与不作弊之间的界限似乎取决于完成任务所需的时间。例如,如果一名学生访问图书馆档案馆以研究诺曼底登陆后一周发生的事情,将一些缩微胶片卷入一台古老的机器中,并尽职尽责地记下笔记,我们可能给学生谷歌搜索中的同一篇文章——当他转述某些维基百科编辑对该文章的阅读更是如此。
应该学习什么
根据这种逻辑,作业的目的不是创造新的学识或正确回答问题,而是习得正确的学习习惯。花时间去图书馆的年轻人更有可能养成某种工作习惯,使他能够找到可能对创作小说、算法或令人信服的论点有用的附带信息。撇开明显的不诚实行为不谈,作弊的问题并不在于学生跳过了解释所学内容的过程,而在于他们剥夺了自己实际阅读书本的耗时劳动。
互联网给课堂带来的根本危机之一是:由于事实和历史的参考不再需要存储在你的大脑中,所以实际上你不再需要学习任何东西。搜索引擎、维基百科和 ChatGPT 都有相同的解释:如果我们有这些工具,那么这些课程的意义何在?即使教育趋势来来去去,学校往往变化缓慢。但是,近年来,我注意到人们对于孩子应该在人文学科中学习什么的看法,发生了微妙的转变。只注重记忆的做法,在很大程度上已经消失了。孩子们不再被迫说出布拉格第一次破窗事件(1419)的日期或记住相同的词汇表。
然而任何共识的实际实施,可能需要数十年才能完成。这种低效率可能是有害的——例如,美国学校取消手机的时间太长了——但它也导致了一些小恐慌,比如当前围绕大语言模型作弊的恐慌。我不认为人工智能会以某种革命性的方式鼓励作弊,而且我认为抄袭行为的增加,可能更多地与大学招生压力、高中竞争氛围有关。在这种情况发生改变之前,一些孩子会将任何新应用程序转变为作弊工具——与此同时,教育技术公司将出售拦截作弊工具,这样的循环就会重演。
其他阅读
热门跟贴