打开网易新闻 查看精彩图片

基于英文学术写作任务的高校师生AI素养调查研究

崔莹 Christian D.SCHUNN

东北师范大学中国赴日本国留学生预备学校 匹兹堡大学学习与发展研究中心

摘要

生成式人工智能(Generative Artificial Intelligence,简称GenAI)技术在高等教育教学中的广泛应用引发了英文学术写作领域的深刻变革,同时也带来新的伦理与教学挑战。为全面了解中国高校师生在英文学术写作任务中的AI素养现状,本研究基于联合国教科文组织发布的《学生人工智能能力框架》和中华人民共和国教育部发布的《教师数字素养》,构建了“技术应用—认知策略—伦理意识”三维度的AI素养框架,并在全国范围内对不同地区、学科的高校师生开展问卷调查。结果表明:(1)在英文学术写作中,高校师生GenAI的技术应用以及所采用的认知策略,因学科与身份的不同而存在显著差异;(2)高校教师虽然对GenAI技术持开放态度,但对伦理风险的感知度相对较高;(3)学生群体在技术应用上表现积极,但在伦理意识方面仍有提升空间。本研究的结论为完善中国高等教育领域的人工智能素养评估体系提供了本土化的实证依据,也为后续相关研究与实践提供有益参考。

关键词:生成式人工智能;人工智能素养;高等教育;写作教学

01

引言

人工智能(Artificial Intelligence,简称AI),特别是生成式人工智能(Generative Artificial Intelligence,简称GenAI)的快速发展为英文学术写作教学带来了积极影响,但同时也带来了新的挑战(Rodafinos 2025;Tran et al.2025)。在AI赋能英文学术写作背景下,学习者能否有效应对挑战,合理且充分发挥人工智能工具的作用,良好的AI素养至为关键。现有AI素养研究虽已在维度框架上取得一定共识(Ng et al.2024;尹开国2024),但存在调查对象与地域单一、未考虑学科属性等问题,尚未充分回应英文学术写作这一高度专业化且伦理高度敏感(孙莉2015;赵冠芳、吕云鹤2019)的教育实践。

基于此,本研究以Bloom等(1956)提出的认知能力框架为基础,融合联合国教科文组织发布的《学生人工智能能力框架》(UNESCO 2024)与中华人民共和国教育部颁布的《教师数字素养》(中华人民共和国教育部2022),并结合英文学术写作的特殊要求,构建了包含“技术应用—认知策略—伦理意识”三维度的英文学术写作AI素养分析框架,并以此框架为基础,在全国范围内开展问卷调查,旨在较为全面了解高校教师与学生在英文学术写作情境下的GenAI素养现状,重点揭示群体差异及其背后的深层机制,力求为中国高等教育智能化转型提供本土化的实证依据,为推动英文学术写作教学数字化升级的理论建构提供数据支撑。

02

文献综述

2.1 GenAI介入英文学术写作的工具赋能与伦理风险

以ChatGPT为代表的GenAI工具,为英文学术写作带来了积极影响。基于大语言模型的写作工具,能够在选题构思、文献检索、语言润色、论证展开等方面提供即时的自动化反馈与示例,大幅度提升写作者的写作与学习效率(Guo&Li 2024;Jacobsen&Weber 2025;Rodafinos 2025;Tran et al.2025;Wang et al.2024;Yan 2023)。具体而言,通过即时反馈和个性化指导,AI工具能够帮助写作者掌握学术语篇的逻辑结构与论证方式、提升写作者的参与意识与动机,促进批判性思维的培养(Essel et al.2024;Rodafinos 2025;Wang et al.2024)。此外,GenAI工具所提供的连续对话与追问方式,使写作者能够围绕写作问题与AI进行多轮、深入的即时互动,使写作者得以围绕具体的写作任务展开持续的探究与反思(Essel et al.2024),能够在一定程度上弥补传统教学中指导不足的问题(Su et al.2023),为英文学术写作教学带来了新的机遇。

然而,英文学术写作不仅需要写作者具备良好的语言功底与论证逻辑,更需要展现较强的思辨能力、学术规范与诚信意识(赵冠芳、吕云鹤2019)。GenAI工具的介入不可避免地引发伦理思考。虽然GenAI能够检索信息与文献、辅助阅读与整合文献,却也可能因“模型幻觉”而生成不存在的文献或错误信息,从而影响写作内容的准确性(Amirjalili et al.2024;Essel et al.2024;Wang et al.2024),若写作者缺乏有效的验证与评估能力,可能会将不准确的内容直接纳入写作文本(Amirjalili et al.2024;Escalante et al.2023;Rodafinos 2025;Tran et al.2025)。GenAI工具虽然能够提升写作效率,但写作者对AI的过度依赖可能削弱其在写作论证和推理中的主体性,进而对学术诚信与责任归属提出了新的挑战,包括潜在的抄袭风险、作者身份模糊以及规范界限不清等问题(Amirjalili et al.2024;Rodafinos 2025;Tran et al.2025;Yan 2023;金艳、徐孟婕2024),这也是促使部分教师对AI工具在教学中的应用持审慎态度的重要原因。以上风险表明,AI工具的使用需要建立在明确的教学指导与伦理规范基础之上(Essel et al 2024;Rodafinos 2025)。

2.2 英文学术写作中的人工智能素养模型建构

本研究之所以选择并融合《学生人工智能能力框架》(UNESCO 2024)和《教师数字素养》(中华人民共和国教育部2022)构建分析框架,是因为二者具有较强的互补性:《学生人工智能能力框架》基于全球数字教育理念,涵盖了学生应具备的AI通用能力,为本研究提供了跨文化、跨任务的基础性结构;而《教师数字素养》作为我国本土的政策性文件,聚焦教师的数字化意识、能力与责任,能够清晰地反映出我国教师在信息化教学实践中应具备的核心能力需求。基于两者的维度特征与Bloom等(1956)的认知能力框架,本研究提出“技术应用—认知策略—伦理意识”三维度的英文学术写作AI素养框架。

具体而言,该分析框架中,技术应用维度对应《学生人工智能能力框架》中的“AI技术与应用能力”;认知策略维度源于该框架中的“以人为本的AI观念”;伦理意识维度则直接保留,凸显学术诚信、社会责任与价值判断的重要性。相较之下,“AI系统设计”因偏向技术研发,并非与写作教学直接关联,故未纳入本研究框架。同时,《教师数字素养》中的“数字技术技能”和“数字化应用”归入技术应用维度,“数字化意识”对应认知策略,“数字社会责任”对应伦理意识,而“专业发展”因与本研究的相关性较低而予以剔除。

2.3 三维度模型的内涵界定

本研究所构建的三维分析框架中,技术应用维度侧重师生在英文学术写作中的AI操作技能,强调利用AI技术解决问题的能力(Ng et al.2024)。在GenAI赋能英文学术写作中,这种能力具体表现为:在写作任务驱动下,根据需要使用AI工具的频率;合理选择并操作AI工具完成任务和解决问题的能力,如生成文献综述、改写句式、优化逻辑结构、将AI生成内容与个人学术意图整合等。认知策略维度凸显师生在使用AI辅助英文学术写作过程中的主体地位,在了解技术的基础上评估AI技术的有效性和价值(Ng et al.2024;UNESCO 2024)。具体体现为师生能否在明确写作目标的基础上识别AI工具的优势与局限,判断其在不同写作环节中的可接受程度,并据此形成有效的策略决策。例如,师生在文献整合、论证建构或逻辑组织的过程中,根据对工具有效性的感知或对生成内容产生的正向体验(如效率提升、语言优化)与负向体验(如事实性错误、缺乏原创性)来决定在不同任务中技术的介入程度(GenAI作为主要工具、辅助工具或完全不使用)。这些有效性的评估和策略性的选择是认知调控的基础,使AI技术能够服务于学术写作,而非替代人进行独立思考与写作。伦理意识维度关注风险评估与责任决策,体现英文学术写作特有的学术诚信与伦理要求,即要求师生对生成内容的正确性负责,而不是简单地将未经核实的信息作为学术成果使用、明确使用者在学术写作中的责任(Singh&Kaur 2025;UNESCO 2024;Wang et al.2025)。同时应清楚理解,技术应用、认知策略与伦理意识并不是完全独立的三个维度,而是在实际写作过程中,三者相互作用。伦理意识是AI素养的前提条件,通过影响师生对技术边界的理解,塑造其认知判断与策略选择,进而反映在具体的技术使用方式上;与此同时,技术操作的经验也会反过来影响对技术的评估,甚至影响伦理立场(Ng et al.2024;UNESCO 2024)。此外,作为一种基本素养,AI素养也受使用者的性别、年龄、专业等因素影响而呈现明显的个体化差异(Gezer&Karagözoğlu 2023;Kim&Lee 2024;Qu et al.2024)。

2.4 问题的提出

既往研究已揭示,GenAI在写作教学中的应用呈现效率提升与伦理风险并存的实践悖论(Essel et al.2024;Yan 2023),其赋能效果受到师生AI素养的制约。然而,当前研究存在以下局限性:现有研究多聚焦AI写作工具功能的探讨或赋能效果的评估,对高校师生在实际英文学术写作教学中所具备的AI素养结构、群体差异及其内在逻辑缺乏深入且系统的阐释。在中国高等教育背景下,师生对GenAI技术的实践数据匮乏,难以有效回应“如何构建适切性的AI赋能路径”这一核心命题。

基于上述研究现状与问题,本研究拟从技术应用、认知策略和伦理意识三个维度开展现状调查,旨在较为全面地揭示中国高等教育背景下,高校师生在英文学术写作中AI素养的现状,分析不同学科背景、身份特征(教师与学生)、年龄、性别与地域等因素对AI素养的影响,为后续构建适切性的AI赋能路径提供实证基础,以实现素养内涵向教育实践的有效转化,具体研究问题如下:

(1)中国高校师生在英文学术写作中对GenAI的技术应用具有哪些特征?这些特征是否因学科背景、身份特征、年龄、性别与地域等因素而存在差异?

(2)中国高校师生在借助GenAI辅助英文学术写作时,其认知策略呈现怎样的特征?这些特征是否因学科背景、身份特征、年龄、性别与地域等因素而存在差异?

(3)中国高校师生在借助GenAI辅助英文学术写作时,其伦理意识体现出哪些特征?这些特征是否因学科背景、身份特征、年龄、性别与地域等因素而存在差异?

03

研究方法

3. 研究方法

3.1 调查对象

高校师生构成了本研究的调查对象。学生包括本科生、硕士研究生和博士研究生,教师包括助教、讲师、副教授和教授。共有521名参与者完成了调查。然而,20名参与者(4%)由于答案不完整且信息不准确,被排除在分析之外。剩余501名参与者包括285名本科生、101名研究生(硕士和博士),以及115名大学教师。整个样本涉及22个省、四个直辖市和四个自治区。为了便于分析,本研究将其分为七大区域,即华北地区(12.1%)、东北地区(37.1%)、华东地区(15.7%)、华中地区(11.5%)、华南地区(4.7%)、西南地区(4.4%)和西北地区(14.5%)。参与者以女性为主(65%)。年龄横跨18~69岁,共分为五个年龄组:18~20岁(33.7%)、21~22岁(22.5%)、23~25岁(13.6%)、26~39岁(13%)、40岁以上(17.2%)。参与者来自人文社科(53%)、理学(9%)、医学(21%)和工学(17%)等不同专业。

3.2 测量工具

本调查采用自编问卷,共包含34道题,按内容分为三部分:(1)知情同意和被试信息统计;(2)关于GenAI使用的多项选择题;(3)关于GenAI使用的开放式问题。统计结果显示,问卷的一致性信度良好(α=0.8)。基于AMOS的结构方程建模结果显示,模型达到合理拟合水平(RMSEA=0.064)。接下来本节详细介绍调查问卷中三个维度的考察要点和分析路径。

GenAI的技术应用:技术应用维度涉及工具选用、使用频率与用途。参与者需根据使用经历从提供的10种国内外AI工具中进行选择,并可补充其他工具。在使用频率方面,参与者需报告曾经在学术写作任务中使用GenAI的次数,并从以下范围中选择:0次、1次、2~3次、4~5次、6~10次、11次及以上。参与者需根据自身经验,回答尝试使用的相关问题(例如“您尝试过GenAI的哪些用途?”)。问卷提供以下七种可能的用途:信息搜索、构思生成、草稿撰写、段落扩展、结构优化、语法检查和语言润色,参与者可多选。根据写作反馈类型(Cui&Schunn 2024),本研究区分高层次用途(意义层面用途包括信息搜索、构思生成、草稿撰写、段落扩展)和低层次用途(表层层面用途包括结构优化、语法检查、语言润色)。

GenAI的认知策略:认知策略维度涵盖了使用者是否有AI使用的意识、可接受的使用功能以及对其有效性的判断。在问卷中,参与者需首先回答是否有意识使用GenAI工具进行写作(“是”或“否”)。随后,参与者需回答以下两类问题:可接受的使用用途(可多选,例如“在写作任务中,您认为哪些GenAI的使用是可接受的?”)和使用效果(例如“您如何评价GenAI对写作效果的提升?”)。针对每类问题,问卷同样提供七种可能的用途:信息搜索、构思生成、草稿撰写、段落扩展、结构优化、语法检查和语言润色,并分为高层次用途和低层次用途。关于使用效果,参与者需以七点李克特量表(从“非常无效”到“非常有效”,含“不知道”选项)对每项用途进行评分。问卷采集了参与者在学术写作中对GenAI整合方式的偏好:作为主要工具、辅助工具或完全不整合。此外,本研究还设置了开放式问题,用于收集参与者对改进人工智能工具整合方案的具体建议,并要求参与者详细回忆和描述使用人工智能的积极或消极经历。

GenAI的伦理意识:伦理意识维度包括价值判断与责任决策、风险评估与伦理担忧。参与者被要求回答在使用GenAI生成内容时,对生成内容可靠性的验证意识。可供选择的验证方式包括:自行通过已知信息进行验证或通过朋友同事进行验证、与其他来源进行交叉核对、使用其他人工智能工具进行验证、完全不进行检查,以及其他(需填写具体内容,3%的参与者选择了此项)。此外,参与者还需从列表中勾选出在使用GenAI进行写作时的具体担忧(可多选):过度依赖技术、被指控抄袭、生成内容缺乏原创性、被指控违反学术伦理、生成结果质量低或存在错误、学习使用工具耗费过多精力、需反复检查内容导致无法节省时间。

3.3 调查实施与数据采集

本研究通过问卷星平台开展数据收集工作,所有问卷均以中文呈现且采取匿名制。具体实施路径包括:借助受访教师的社交媒体实现跨省传播,要求教师群体在填写问卷的同时,向其执教学生发放调查问卷。

04

研究发现

4.1 生成式人工智能的技术应用特征

研究结果显示,在GenAI工具的选择上,DeepSeek、Kimi、豆包、文心一言的使用率占比最高(65%)。就使用频率而言,在一次英文学术写作任务中,使用4~5次的参与者占比最高。各群体多呈现差异化双峰分布特征:高校教师群体中“从未使用”与“使用频次达11次及以上”占比最高(25%与23%),本科生与研究生群体的使用占比趋同,“从未使用”在硕士研究生群体中占比最低(7%)。

在GenAI的高层次用途尝试使用(例如信息搜索、构思生成等)和低层次用途尝试使用(例如语言润色)方面,身份与专业[F(2,498)=7.93,p < 0.01,η2p = 0.031;F (3,497) = 2.67,p <0.05,η2p = 0.016]是与尝试使用范围显著相关的潜在预测变量(效应量在0.01至0.06范围内为小效应,在0.06至0.14范围内为中效应,0.14及以上为大效应)。本科生和研究生在高层次和低层次用途的尝试使用中的比例较高,大学教师的尝试使用比例相对较低。专业对高层次尝试使用范围具有显著预测作用[F(4,848)=4.1,p<0.01,η2p=0.017],而对低层次尝试使用范围无显著影响。理学与工学专业参与者对高层次尝试使用的比例较高,其中理学专业参与者显著高于其他三类专业。

4.2 生成式人工智能的认知策略特征

研究发现,90%参与者对GenAI工具有使用意识,但其使用意识水平因身份[F(2,498)=2.92, p = 0.05, η2p = 0.012]、专业[F (3,497) = 2.69, p < 0.05,η2p = 0.016]、年龄[F (4,496) = 2.76,p < 0.05, η2p = 0.022]和地域[F (6,494) = 2.91, p < 0.01 η2p = 0.034]的不同而呈现显著差异。具体而言,研究生的使用意识最高(96%),而大学教师最低(85%);理学与工学专业显著高于医学专业;25岁左右群体最高(100%),而40岁以上群体最低(83%);华南与华东地区高于东北和西北地区。

在GenAI的高层次可接受使用方面,在身份、年龄、性别、专业和地域等潜在预测变量中,只有专业呈现统计学显著性[F(3,497)=2.8,p<0.05,η2p = 0.017]。其中,理学专业的参与者赋分最高,而人文社科专业的参与者最低。就低层次可接受使用而言,身份、年龄、性别、专业和地域等潜在预测变量均未达到统计显著性。然而,比较发现,人文社科专业的参与者在低层次可接受使用上的比例最高。

就GenAI的有效性而言,预测变量中只有专业[F(3,470)=3.65,p<0.01,η2p = 0.023]与地域[F(6,467) = 2.04,p = 0.05,η2p = 0.026]呈现统计学显著性。具体而言:工学与医学专业的参与者对GenAI有效性评估分值显著高于理学与人文社科专业;华南、华东、西南地区的参与者对GenAI有效性评估分值显著高于其他地区。在工具整合方面,91%的参与者认为GenAI应作为辅助工具,而非主要工具或完全不使用。为进一步探讨不同因素是否会影响参与者对GenAI在写作中整合方式(即主要工具、辅助工具、完全不使用)的偏好,研究采用了逻辑回归分析。然而结果显示,没有任何变量能够显著预测不同的整合形式。

为探究使用GenAI工具进行写作时的正负向体验,本研究采用DeepSeekR1对开放式问题的回答进行两步分类。首先,我们综合所有回答生成初始类别;然后,在初步结果的基础上进一步修订和完善描述,最终识别出三类负向体验:不准确与错误信息、缺乏创造力与独创性、过度依赖;以及三类正向体验:效率与节省时间、创意生成、语言润色。随后,我们对不同群体所提及的正负向体验的频率进行了编码与统计(见表1)。结果显示,本科生和大学教师最常提及的负向体验是不准确与错误信息,研究生最常提及的正面体验是节省时间,而过度依赖仅在研究生群体中被视为潜在担忧。

打开网易新闻 查看精彩图片

4.3 生成式人工智能的伦理意识特征

研究发现,自主验证(由本人、朋友或同事基于既有知识进行核查)与交叉验证是最常见的两种方式,但研究生更倾向于通过多源信息进行交叉验证,而教师则更多依赖学术经验与专业判断(自主验证)。其中,自主验证在26~39岁年龄组中最常见,而交叉验证则主要出现在研究生群体和23~25岁年龄组。相较之下,利用其他AI工具进行验证的比例整体较低,但在研究生和21~22岁年龄组中使用率相对较高。完全不进行验证的情况最少见,且其比例随年龄增长呈现逐渐下降趋势。在参与者对GenAI的担忧中,最突出的因素是过度依赖,其次为生成内容的质量问题;相比之下,对道德风险和精力浪费的担忧程度相对较低。在所有群体中,对质量的担忧始终高于对道德的担忧。在所有预测变量中,仅身份因素在道德风险的担忧上呈现统计学显著性[F (2,498) = 5.74,p < 0.01,η2p = 0.023],其中教师的担忧程度最高,本科生最低。

05

5.1 人工智能在高等教育英文学术写作中的技术应用

本研究探讨了GenAI在英文学术写作中的技术应用特征及其群体差异。研究数据表明,教师与学生在GenAI的实际使用行为上存在显著差异:高校教师的使用频率所呈现的双峰分布特征最为明显,即零使用者与高频使用者的占比均最高,形成了两极分化。相比之下,研究生的零使用与高频使用占比相对偏低。这一结果反映了学术规范与技术应用共同作用的内在机制,与学术规范塑造技术信任进而影响技术使用的观点相呼应(Ngetal.2024;UNESCO2024)。教师往往承担较重的科研任务,对提升写作效率、辅助文献整合与语言润色等方面都有使用需求,在对学术规范有较为清晰的认知的基础上,这类教师倾向于将GenAI视为一种高效的学术工具来使用;而另一部分教师则可能因对GenAI技术的伦理风险和学术诚信的不确定性保持高度警惕,或出于对现有学术规范的维护,而采取谨慎、回避的使用策略。研究生群体的使用现状,则体现出他们在提高写作效率与学术规范之间的权衡与摇摆。这提示我们,英文学术写作教学中,技术的应用有必要依托“伦理意识”与“策略性使用”的引导(Singh &Kaur 2025)。

AI使用行为的差异还与学科属性密切相关,如理学与工学群体在高层次功能的尝试使用方面表现更为积极,此现状与认知策略中可接受的使用功能的结果相一致,进一步佐证了技术应用与认知策略相互作用的观点。理学与工学在学术研究中通常以问题解决、模型验证、技术效率与可复制性为导向,倾向于接受工具在解决复杂任务中的功能价值(Becher&Trowle 2001; Biglan 1973),在保证结果可验证的前提下,更倾向于尝试将GenAI融入学术写作的环节。从技术扩散规律视角看,这种使用差异恰好印证了创新扩散理论(Rogersetal.2008),理学与工学专业的师生基于专业知识判断,更有可能作为技术的创新者与早期采用者,于是更倾向使用GenAI作为写作工具;人文社科专业的师生则可能因为对AI持怀疑态度,不敢使用或认为用不上而成为技术落后者。这一结果为探究GenAI在学术写作中的扩散路径提供了实证支持。

5.2 人工智能在高等教育英文学术写作中的认知策略

在认知策略层面,本研究揭示了高校师生在英文学术写作中对GenAI的使用意识、工具定位与评价的认知差异。数据显示,虽然90%的参与者具备AI使用意识,但在专业、年龄与区域维度上存在显著差异(如理学与工学>医学,25岁群体>40岁群体,华南与华东地区>东北与西北地区),即技术认知与学科范式、年龄差异与地域发展水平密切相关。年龄变量的显著差异揭示了数字原生代(从出生起就成长在互联网、计算机、智能手机、社交媒体环境中的人)与数字移民(在生命某个阶段才接触并采纳了新技术的人)之间的技术认知分化。这与技术惯习理论(Ignatow&Robinson 2017) 形成互文,年轻学者更早接触并频繁使用数字技术,对GenAI的功能具有更强的接受与适应能力;而年长群体在学术写作中已形成相对稳定的写作行为与工具惯习,对新技术持有更加谨慎的态度。因此,教学干预研究应多以年轻学生为样本,以提升其AI素养。此外,地域认知差异表明,数字资源供给的不均衡可能进一步加剧不同地区师生在AI素养发展路径上的分化。因此,有必要通过资源共享、在线培训与开放课程等方式,缩小地域在使用意识层面的差距(如北京邮电大学的AI魔镜)。

在可接受的使用方面,本研究结果与Gezer和Karagözoğlu(2023)的发现一致,即与数字技术和应用紧密相关的学科,以及更频繁使用数字工具和资源的学科更倾向接受GenAI技术。此外,本研究还说明了不同学科所关注的不同层面:理学群体更倾向接受GenAI的高层次应用,而人文社科群体则偏向低层次应用。这种工具的认知差异与学术部落理论(Becher&Trowle 2001)高度契合,GenAI在信息检索、问题解决、模型验证等方面的功能与实证主义研究的需求相契合,而软科学领域则更可能将其视为修辞优化工具。此外,有效性评估的结果与尝试使用和可接受的使用的判断在结果中所呈现的矛盾表明,GenAI虽然因其能够为英文学术写作提供全面的支持而被师生所接受,但其在内容创新、准确性与论证深度等方面的局限尤为显著(Esseletal. 2024; Rodafinos 2025; Tran et al. 2025),进而降低了使用者对工具有效性的评价,随着使用频率的增加,写作者所判断的低效性可能是一种更准确、更负责任的评估。由此可见,GenAI的有效性评估并非单纯依据技术本身的性能,而是与学科要求、使用者的经验感受密切相关。这一结果对英文学术写作教学具有启示意义。在教学设计中,注意避免将GenAI的技术简化为统一技能训练,需要依据学科特点设计不同的认知策略培养方案:在理工类写作课程中,可引导学生反思高层次应用如何服务论证质量与学术规范;在人文社科写作中,则可在明确使用边界、评价标准与保持学术主体性的前提下,逐步探索更深入的技术整合方式。

91%的参与者将GenAI定位为“次要工具”,这与Tran等(2025)的观点一致。在一定程度上反映了高校师生在学术规范的约束下,对技术价值的认知较为保守。这种集体性的技术保守现状诠释了学术写作中以人类为中心的技术赋能(UNESCO2024)。将GenAI视为辅助性工具,意味着其功能可能被限定在语言润色、结构建议或初步构思生成等支持性环节,而核心论证、知识整合与学术判断仍由写作者自身完成,保持写作者的批判性思维。这既体现了使用者对GenAI在高效与便利等优势的认可,也表明其对生成内容可靠性、原创性及学术责任归属等问题的警觉。值得注意的是,高校教师的使用意识水平较低,这与伦理意识中教师对伦理的高担忧度形成参照,展现出教师群体的防御性认知策略。以上结果共同印证了AI素养的三个维度之间存在显著的相互作用关系(Ngetal.2024;UNESCO2024)。

5.3 人工智能在高等教育英文学术写作中的伦理意识

GenAI生成内容的准确性的验证路径并非单纯的技术选择,也体现了使用者的价值判断与风险评估(Wangetal.2025)。在使用者看来,AI生成的内容的来源是不透明的、可能伴有事实性错误、虚构文献或者论证逻辑偏差等问题(Esseletal.2024),需要采取有效的措施进行确认。在英文学术写作任务中,如果生成内容的准确性无法被确认,便可能转化为学术不端或责任归属不清的伦理问题。不同群体在选择验证路径时表现出差异,研究生更偏好交叉验证和利用其他AI工具验证,这可能源于其对技术工具的信任。而教师更倾向于使用专业知识和经验来验证内容的准确性和可靠性,这可能与其长期形成的学术知识结构与专业自信密切相关。验证偏好的差异也与结果中对过度依赖的担忧程度最高相呼应,因此在教学中,教师需要教会学生批判性地看待AI生成内容,避免过度依赖AI工具(Esseletal.2024)。

在群体差异中,学生更倾向于将AI视为提升写作效率的工具,而教师则对AI可能带来的学术诚信风险与责任模糊问题更加敏感(Esseletal.2024)。这一差异可从学术中责任角色的不同得到解释。教师不仅是学术规范的执行者,更是学术规则的维护者,他们对潜在的抄袭、责任模糊等问题更为敏感。师生的立场不同,可能在写作教学情境中引发潜在的教学冲突(Moorhouse et al. 2025),学生的抄袭和责任不清等学术诚信风险,也将进一步导致教师的伦理担忧(Essel et al. 2024)。因此,在英文学术写作教学中,有必要通过明确规范制度和示范性指导将教师的伦理判断转化为可被学生理解和内化的学术实践准则。从教学管理视角看,这一结果提示高校在推进GenAI融入英文学术写作教学时,亟须回应教师群体对伦理的关切,通过制定明确的使用规范、责任划分与评价标准,缓解教师群体的担忧;同时,也有必要通过全面的伦理教育,引导学生从“工具使用者”转向“责任主体”,助力师生群体在伦理认知层面的共同发展(Singh&Kaur2025;Wangetal.2025)。

06

结论与启示

本研究通过对高校师生的调查,系统揭示了GenAI在高等教育英文学术写作中的技术应用、认知策略和伦理意识三个维度的现状。结果显示:(1)高校师生对GenAI的技术应用和认知策略,因学科与身份的不同而存在显著差异;(2)高校教师虽对GenAI技术持开放态度,但在伦理风险感知上显著高于学生;(3)学生群体虽然在技术应用上表现积极,但在伦理意识方面仍有提升空间。上述发现不仅为中国高等教育智能化转型提供了本土化的实证依据,也为推动英文学术写作教学数字化升级的理论建构提供了数据支撑。

本研究为GenAI在高等教育英文学术写作中的教学应用提供了实证依据,揭示了教师与不同教育阶段学生在技术应用、认知策略和伦理意识上的差异。研究结果对英文学术写作的教学实践与研究发展具有以下启示:

(1) 重视学科间差异。研究发现,学科背景显著影响AI在学术写作中的使用方式。教师应据此制定学科化的AI辅助教学策略,帮助学生在各自学科范式内合理利用AI,以提升英文学术写作的质量。

(2) 支持教师AI素养发展。高校应该助力教师AI素养培训和发展,教师的AI素养会通过任务设计、使用示范与写作评价等方式影响学生AI素养的发展。

(3) 强化伦理教育与学术诚信。高校应将AI伦理教育系统融入英文学术写作课程,强化引用规范、责任意识、数据溯源与内容验证等训练,培养学生在AI协同中保持批判性意识与学术责任感。

本研究也存在一定局限性。首先,研究主要基于问卷数据,难以揭示师生真实的AI使用行为。未来可通过课堂观察与学习日志等方法,追踪教师与学生的AI技术应用与认知策略。其次,伦理意识的测评仍依赖自陈数据,难以反映学习者在真实写作中的价值判断。未来可开发结合质性与量化的多模态工具,更全面地揭示AI使用的伦理机制。因此,现有框架尚缺乏成熟的标准化评估体系,相关测评工具仍处于探索阶段。无论是技术应用的操作性指标、认知策略中批判性思维的内隐过程,还是伦理意识的价值判断维度,都依赖于测评工具的进一步开发,这对研究方法提出了更高要求。

文章来源:外语与外语教学