打开网易新闻 查看精彩图片

问责制是当今全球教育政策的一个流行语,联合国教科文组织2015年发布的《2030年教育行动框架》中有20多次提到问责制。对政府的教育工作进行评价是现代社会治理体系的重要组成部分,评价结果用于对政府问责,以督促其更好履行教育职责。英国是严格实施教育督导评估制度的国家,也是少数对地方政府教育工作进行专门督导的国家,督导问责的主要内容聚焦于地方的教育治理效能。我国是高度重视区县政府教育工作评价的国家,有地方政府的教育工作绩效评价、教育履职督导评估等多种类型,以期推动区县人民政府办好人民满意的教育。评价指标是引导、指挥和解释政府行为的关键变量,评价工作已经成为建设教育强国、推动教育治理能力现代化的重要手段。然而,不少地区的教育工作评价延续了以前教育规模发展阶段的惯性,不论是评价功能还是评价工作自身质量对建设教育强国的响应均不够充分。评价工作的高度行政导向和封闭性、学者难以参与评估“现场”等原因导致相关研究数量非常少,对地方政府教育工作评价改革的研究支持严重不足。

《教育强国建设规划纲要(2024—2035年)》提出“提升依法治教和管理水平”“完善督政、督学、评估监测教育督导体系”。《加快建设教育强国三年行动计划(2025—2027年)》提出“完善政府教育履职评价”。《中共中央关于进一步全面深化改革 推进中国式现代化的决定》明确提出处理好效率和公平的关系,因而更高效率也是高质量发展的重要特征。质量、公平和效率亦应作为当前政策对教育工作评价内容改革和工作体系完善的价值要求。本文重点讨论相对于教育规模发展阶段,区县政府教育工作评价应如何调整评价内容和方式,以高质量的评价实践适应新时期教育强国建设的需要。

一、传统评价框架面临的挑战与转向

(一)社会需求方向的转变

经济高速增长阶段对社会发展水平的评价主要关注规模总量的扩张,强调工具性价值,评价对象往往表现为锦标赛式的竞争状态。社会对规模增长成就的感受具有可直接计量性和可观察性,如校舍面积改善、学生补助人数增加等。为了推动地方政府加强教育投入,经费、人力、物质条件等要素的投入数量和覆盖面是重要指标,如校舍面积、教学仪器设备值、生师比、教师学历水平等。这种现状或水平性统计表达方式的价值取向在于规范管理、推动地方政府落实可测性政策,但反映政府实际治理水平的能力较弱。总体上,各行业政府绩效评价中均存在指标设计重客观轻主观、重量化轻质化、重排名比较轻政府治理能力提升等共性问题。已有研究证明,核心要件满足后服务对象满意度水平不再直线上升,可以理解为人民对美好生活的需求日益增长,但物质水平的提高并不总能提高满意度水平。中国民生电话调查结果显示,2013—2017年全国教育经费总投入约增长40个百分点,但2014—2017年的教育满意度仅增加了0.01分,在参与测评的各行业中满意度增长率最低。这表明以往的教育发展和投入模式进入边际效应降低的阶段,提高教育投入效应要转变治理模式。有学者建议,在关注办学条件等基础性要素的同时,应将评价重心转向对地方党委和政府治理体系与治理能力现代化水平的问责上。文献研究还显示,不论发达国家还是发展中国家,教师能力对学生成绩的解释力更强,资源的使用率比资源投入量产生的效应更大。相对于基本均衡时代,县域义务教育优质均衡评估对学生发展结果的强调反映了国家层面评估重点的转向。与教育治理效能有关的指标,无论是客观的学业成绩、资源使用率、资源供给适切性,还是主观的满意度、权利感等,都涉及对服务对象的参与和体验的测评,评价难度大幅增加。

(二)价值认识的新动向

在义务教育普及阶段,不少研究将教育效率限定为教育资源的投入效率,用单位投入能够产出多少教育资源或者服务多少学生来衡量,将其定位于与教育公平存在冲突关系。随着高质量发展治理理念的提出,社会对效率的重视程度逐渐提高,学者们认为高质量发展的核心要义是建立在更加公平基础上的更高效率。世界银行的研究报告提出,一个模范地方政府应在程序和结构上符合立法,保持其财政健康,以正确的方式(最大效率)做正确的事(对民众需求作出回应),并对其过程和产出负责。国际上广泛使用有效性、经济性、效率性、公平性作为公共部门绩效评价的基本原则。我国对基础教育发展的价值追求已从普及、基本均衡走向优质均衡,体现了对教育公平和质量要求的提高,而减轻学业负担、应对人口减少的资源配置策略改进等政策体现了效率价值维度正逐渐受到关注。立足教育强国建设,以优质、公平、高效为高质量发展的内在核心价值要求,各类教育发展指标均可从质量、公平、效率等价值维度进行考察,并且不再简单分类为哪些属于公平指标、哪些指标专用于评价质量,而是每个指标均坚持此三维价值导向。

(三)治理模式的完善要求

目前,履职评价中一般将投入、过程与结果作为并列关系赋权重相加,较少计算投入产出比较得出的效率、过程对结果的贡献度。并且,过程性、具体措施性指标数量占比过大,更有甚者将政策原文拆解成一条条事项性指标考察下级政府是否遵从。与教育热点问题有关的事项检查更多,热点问题事项检查带有较强的应急意味,这与社会变化较快导致的政策制定应急性特点有关。有时教育热点并不是根本性的问题,如学生校服在一些地区统一样式且在校外商超自主购买,并不成为一项社会问题。由于不断有新政策产生,过程性指标越来越多,地方评估负担越来越重却实效不高,最终导致一些地区履职评价的停摆。事项性指标过多过细的原因是多方面的,首先,将指标结构的逻辑假定简单化,认为投入和过程的精细化要求与结果指标之间存在强因果关系,现实中三者有可能正相关,也有可能存在高投入低产出的不相关或者负相关情况。其次,从治理角度看,部门利益、信息不对称、属地管理不规范、政绩观偏差、被考核对象缺乏自身工作的话语权等是导致考核指标过度细化的重要原因,考核评价重过程重痕迹,实效却很差,多项研究建议加强结果和目标有关评价指标的设计。也有学者呼吁去指标化评价,通过各评价主体的参与、体验、沟通和对话完成评价任务。从实践和研究趋势看,教育工作评价应从合规性检查转向效能性评价,结构上减少事项性检查占比,关注教育发展规律和发展目标达成度。

二、传统评价实施与管理的效度困境

(一)简单量化的多重负效应

有的地方政府教育工作评价几乎全部采用量化指标,只需要填报数据就给下级政府排出名次。完全量化评价看似精确实则模糊,如音体美学科的校舍场地生均面积能够反映硬件保障情况如何,却难以体现场地实际使用情况、管理情况、是否符合师生需求等。由于高度重视指标的数值水平,专家现场评价往往仅起验证作用或仅按要求履行流程。评价指标和标准的确定一般不会通过专家与评价对象协商产生,因为在评价结果的产生过程中,专家难以发挥对数据的经验解析作用,也限制了其在与评价对象交流时可发挥的指导作用。评价的功能和价值不仅仅是为奖惩和资源分配提供依据,更在于为评价对象提供专业科学的诊断和指导,这是评价权威性和结果信息效用价值的重要来源。

简单量化引发的负面后果是多方面的。不仅隐藏了评价专家的作用,也容易扭曲和腐化它原本打算监管的社会过程。对量的可观测性与优势的追求会改变国家、组织和个人的行动,将质性特征转化为共享同一量纲的量化指标,导致评价去情境化、去人格化,强化数字的权威性并引导评价对象走向功利化。例如,某地以德育活动次数评价学校对德育工作的重视程度,导致学校不断在评估管理系统里上报活动材料,不仅增加了评价负担,更异化了德育活动本身的价值。相反,专家去现场与师生直接交流、观摩学校活动则能够更准确地判断学校对德育工作的重视程度、工作能力和工作质量。

(二)统一标准与因地制宜的艰难平衡

当前的教育工作评价本质是一种分类行为,即把复杂信息结构化、条理化,同时也给评价对象在分类系统中分配一定的位置,会使原本可能差异不大的区县按照分数的细微差异排出名次。多数省份的区县之间,发展基础存在较大差异,如果评价以绝对发展水平指标为主体且要求越来越高,发展基础薄弱的地区在评价结果的排队中会永远处于落后位置,可能带来数据造假或者躺平摆烂等风险。而若降低评价标准,则可能导致高水平区县放松自我要求。统一的评估指标和标准难以全面实现以评促建的目的,社会资源也将容易流向评价结果较好的区县,最终出现强者恒强、弱者恒弱的趋势。此外,人口变化对各地教育工作产生了巨大影响,但该影响存在地区差异,有的地方在校学生人数急剧减少,总量类指标维持增长难度较大,生均类指标提升未必反映真实改善。发达城区在校学生人数仍在增长,提高了教育投入的规模效益,但按照生均指标要求则需继续加大建设力度。当评价指标和标准确定的原则要求坚持因地制宜、实事求是时,评价工作就需要在个性化方面有所作为。

(三)利害性博弈对评价的扭曲

现实利益冲突往往导致评价工作背离设计初衷。评价和问责本身就是治理的工具性手段,评价结果利害性越高评价的功利性就越强,与此同时,评价从设计、过程到结果的质量降低的可能性越大。有些地方为了尽快通过高利害性评估,牺牲其他重要的事情,发生“产出扭曲”问题。例如,在财政能力有限的情况下,停止其他学段的规划项目并将经费集中投入有评价任务的学段。此外,部门利益冲突导致的指标选择偏差、指标政策“打架”等问题一直困扰着教育工作评价。问题产生的根本原因在于政府责任划分不够清晰,横向责任不清导致不同系统的指标要求冲突,纵向责任划分不清导致指标缺乏效力。例如,某地在对“十四五”规划实施情况的中期评估中遇到了职责不清导致的评估困难。招生入学工作由基教部门负责,推动当地通过均衡评估由督导部门负责,由此出现城市基础教育管理行政部门放宽学校规模和班额标准要求以解决入学压力问题,督导部门则坚持严格控制学生规模的矛盾性工作方向。在教育经费、教师编制等指标方面,教育和财政、编制和人社等部门之间也存在着博弈和妥协。调研发现,某经济强区以学生减少为由有编不补、不断大幅削减新招教师编制,采用招聘合同教师的方式满足岗位需求,仍旧能够在全省区县教育工作评价中名列前茅。各方博弈最终产出一个可被多方接受但不那么符合评价目的的结果,高利害性评价反而未能起到推动问责作用。

三、建设优质公平高效价值导向的新框架

传统框架下,教育工作评价一般包括价值导向、组织领导、办学条件、教师队伍和学生发展等维度,内在的程序逻辑包括投入、过程和结果三个环节。从服务高质量发展角度看,评价框架不仅要在质量、公平价值导向基础上增加效率价值导向,还应将各价值导向作为内生性维度嵌套在投入、过程和结果等每个环节中。

(一)质量导向的评价

以往对教育工作质量的评价主要聚焦于教育教学产出端的学生发展结果,如学业成绩、升学率等指标。当将质量作为公共服务效能的重要表征时,则包括教育供给的品质、有效、创新、健康等含义,以及对国家和个体需求响应的及时性。

首先,有关教育投入的评价需超越经费总量、生均投入水平及增长趋势等总量型指标,在结构和方向上深度判断资源配置是否契合教育质量提升目标。尤其应关注财政支出在关键教育结果质量支撑领域的分配比例,如教师专业发展经费与教研活动投入的占比,以及公用经费在课程开发、教学材料更新、技术更新和实验项目等内涵提升工作中的覆盖程度。对基建、人员以及公用支出细目进行比较并评估,有助于揭示资源分配的优先顺序是否合理。同时,教育投入的评价机制应确立健康供给导向,即教育财政投入须与区域社会经济发展水平、人口结构变化、财政可持续能力及教育发展阶段相适配,反对以债务驱动投入或过度基建投入换取短期评价绩效,避免资源错配与结构性浪费从而保障教育投入的长期效益。

其次,过程环节的质量评价应聚焦与学生全面发展稳定相关的核心变量。其一,教师专业时间的结构性保障,即教师用于备课、教学反思、教研活动、个性化辅导与课程设计的实际可支配时间是否充分;其二,学校领导力水平,包括因材施教的实际执行能力、课程设置质量、师生关系质量、学校归属感等方面的建构水平;其三,校外实践与综合活动的制度化安排,包括社会实践、研学旅行、社区服务、职业体验等学习方式的时长保障和质量;其四,学校办学自主权的保障。PISA2015调查证明,学校办学自主权水平与学生学业表现呈正相关,在低社会经济背景学校中效应更为显著。美国纽约市曾对城市公立学校进行了人事聘任、预算分配、课程设置及绩效管理等方面的办学自主权扩权改革,其效果评价证明,改革对提升学校数学成绩、高中毕业率有积极的显著影响。学校作为教育主体的能动性释放是教育结果质量提升的关键因素,这提示我们,评价工作应关注学校在教师招聘、经费使用等关键领域的自主决策空间,使其能够及时响应教育情境的变化。

最后,学生发展结果是衡量教育效能的核心指标,直接反映了教育过程质量与资源转化的效率。统一学业测试的严格政策限制导致了评价工作亟须构建替代性评估路径,以间接方式反映教育结果质量。可聚焦对评价指挥棒的质量控制,如可抽样评估各校期末试卷的命题科学性、内容代表性、能力导向性与难度梯度合理性,适当延伸至对教研员与骨干教师命题素养的评价;教师课堂表现的现场观察与视频分析、学生学习品质的行为编码分析等,亦可作为衡量区域教研能力、教学有效性与学业发展的核心指标。此外,教育结果质量评价不能仅限于学业成就的评价,应扩展至心理健康、社会适应等非认知领域。鉴于心理健康筛查的局限性,可引入外部验证数据,如青少年精神类药品处方区域增长率、学生休学率等作为评价系统韧性的补充。

(二)公平导向的评价

瑞典学者胡森(Husén)提出的教育机会均等三维框架——起点公平、过程公平和结果公平为我国教育公平政策的制度设计与实践评估提供了理论支撑。当前,我国教育工作评价体系已初步覆盖三类公平政策:一是阳光招生、均衡编班、随迁子女入学保障,以及留守儿童关爱体系等政策确保入学机会均等;二是学校标准化建设、校际办学条件差异监测、教师流动机制等推动资源配置的相对均衡;三是教育质量监测监控学生发展结果的校际差异。然而,上述评价对教育组织内部运行的公平体验关注不足,校际资源配置差异和教育质量差异仍是导致社会对政府教育工作不满意的重要因素。为促进教育公平政策从资源的均等迈向赋能的均等,教育公平评价须在关注制度合规性的基础上强化体验公正性感知评价,在关注结构公平的基础上强化组织公平评价。

首先,应在起点环节深化差异原则实施情况的评价,如评价资源分配是否真正向弱势群体倾斜,是否符合最少受惠者的最大利益。具体评价要点包括新设备、新兴教学项目、高质量培训机会等优质资源是否优先供给乡村学校、薄弱学校以及特殊需求学生等。在结构维度上,须警惕学段间资源“重基础,轻终身”的现象,特别是在老龄化社会背景下,老年教育与社区教育的财政保障力度、课程供给密度、师资配备比例等指标亟须纳入公平评价体系,以实现教育服务全生命周期的公平正义。在过程环节考察教育管理、教育教学活动的公平状况,如重大教育决策公众参与率;教育政策和规则对学校、对师生是否透明无偏,有无隐性歧视或制度性排斥的潜在风险;尤其需关注薄弱学校与小规模学校在教育治理中话语权缺失的问题,在发言机会、经费使用权限、校本教研支持、课程供给需求满足程度和质量等方面与其他学校相比的系统性差异。结果阶段的公平评价在延续前述质量维度评价的基础上应深化群体和校际差异的评价,如比较各类区级活动学生参与率的校际差异、性别差异、户籍差异等;将英才儿童、有心理和学习障碍等困难的学生,以及随班就读学生等少数群体学生的发展结果从过去的不考查或融入均数改为独立评价,并可考查教师差异化教育教学能力、在特殊教育和心理健康教育方面接受的培训课时等,作为特殊需求学生发展水平的补充指标。

(三)效率导向的评价

强调效率既不是推动基础教育市场化,也不是强调规模效应,主要是针对资源利用率不高、教学效率不高、师生负担居高不下等问题,改善效率从而促进教育公平和提高教育质量。

投入环节的效率评价应关注适应人口变化的资源配置、校际资产共享率、教育资产闲置率、规划落地等情况,以及教学仪器设备等资源的使用效率等。教师资源配置效率的评价不仅应关注传统的生师比,还应考查在岗教师中编制教师的比例和教师流失率;从关注人员经费使用效率的角度,应考查教师岗位职数使用率,如检查在编不在岗、在校但不授课等现象;从保障学生享有更优质的教师指导的角度,比较学校总课时数除以含不在岗教师的教师总数、总课时数除以在校且授课教师数等。结果环节的效率评价则需以人口数量、供养比、人均GDP等宏观变量作为控制变量,分析学生成绩、学生活动参与率等因变量与经费投入、时间投入、生师比、课程丰富性等投入变量的关系。

过程环节的效率评价应聚焦如何将投入转化为有效结果,核心是识别阻碍效率提升的关键堵点,破除看不见的藩篱。可依据各地情况关注不同重点,如教师跨校轮岗或调动手续的法定环节数、材料要件数、平均办结时长与一次办结率;中小学校的课程安排、人事聘任、经费使用等办学自主权实际落实程度;学校向主管行政部门申请事项所涉审批层级、流转节点、等待耗时等;学校日常报账票据合规审查时长、财务系统响应速度、资金到账周期与差错退单率等;部门协作的职能边界清晰度、数据和信息共享充分性,以及协同响应及时性等。

四、新框架下的评价效度提升路径

新框架的价值导向同样应成为评价工作效度改进的导向,服务高质量发展的评价工作本身也应以质量、公平和效率作为标准,提高评价效度、降低评价负担,更好地服务评价目标的实现。

(一)完善评价对人群和时态的覆盖,减少偏差

评价内容必须避免出现指标单一问题。例如,以优秀率、平均分为主体的评价指标会导致区县政府和学校只关注排名靠前的群体,而后20%学生及格率、进步率则更可能引导评价对象关注学困生的学习,因此,教学质量评价应将各学生群体的表现结合起来统筹判断。指标的统计方法单一问题也需规避,一个指标的不同统计方法能够产出不同的评价结果,如较为复杂的泰尔指数、基尼系数等各种指标反映出的公平性结果均存在差异;相对简单的均值或中位数差、倍率、倍率差异变化、增长率差异等统计方法以及学生数权重使用策略所蕴含的不同群体的关注度也均有不同。即使一个指标采用多种统计方法,每种方法的偏差都是难以避免的;因此,伊万奥(Ewell)认为目标设定的透明度非常重要,以便在讨论衡量标准时更清楚地理解偏差,并向利益相关者展示指标中哪些群体更为重要。

静态水平值、增减率是当前普遍应用的指标统计方法,如学生近视率、肥胖率及其变化等。静态水平值及增减率都是对已经发生的情况的评价,当指标过于侧重短期结果就会影响评价对象对长期政策的投入。麦克弗森(Macpherson)利用时间将指标划分为在事件发生后报告结果的滞后指标和用于预测未来事件的领先指标,提示人们应重视预期性指标。例如,以师生对在本区县和学校就业就学的忠诚度预测区域教育实际吸引力,以非财政性经费的增长率或教育经费的多元化投入来源预测未来教育系统的抗风险能力,以现任领导决策导致前任政策终止或大幅调整的比例或对现任领导教育政策的长期信心等指标预测教育工作的长期效应。

(二)以主观评价和质性评价为主导,强化人的因素

破除社会和学校唯分数的线性评价思维,首先应从对政府的评价开始去分数化,才能改变对学校、教师和学生评价唯分数的传导。主观评价可以分为两类:一类是利益相关者的态度和看法,如满意度调查;另一类是需要人观察判断的评价,如由专家实施的质性评价。实施主观评价和质性评价加强评价工作中人的属性成分,一方面有助于反映量化评价难以体现的内容,另一方面有助于削减评价范围窄化和功能扭曲的问题。

满意度是指在体验服务过程中,服务对象对其需求、期望和目标得到满足程度的一种心理体验,比投诉率能够更全面反映公众态度,是各国政府绩效评价普遍使用的一种方式。例如,美国佛罗里达州政府教育绩效评价指标包含了认为当地公立学校工作表现良好或优秀的本州人百分比。客观层面的评价必须与公众主观感知进行对照,以免评价结果与公众感知或者体验不一致时引起公众疑虑评价工作弄虚作假。满意度调查能够补充量化调查难以涉及的内容,如手续复杂性、归属感、择区择校意愿等,尤其在判断监测和评价的价值目标达成度方面具有独特作用。教育投入与满意度不是单一线性关系,当实际需求得以满足时,个体才会表达出积极的满意度和获得感。政府绩效目标中工具目标的内容不断增加常会出现与价值目标,即群众的实际需求脱节、错位或偏离的问题。工具目标与价值目标产生背离时,工具目标评价结果与满意度调查结果易出现不一致现象,此时应对评价对象进行深度考察再下结论。

现场质性评价是发挥专家优势的主渠道。但高利害排名次的评价工作更追求量化,一个重要原因是担忧专家现场评价的客观性、公正性和一致性等问题。有学者建议,在合成总评估结论时,可采取由权威性权重、熟悉度权重和公正性权重三部分构成的专家权重进行校正。此外,加强专家选拔、专家培训、增加评价者数量、做好时间地点访谈对象三要素的抽样等工作,对于提高专家评价质量也非常重要。在追求高质量发展的时代,对区县教育治理工作的评价应调换量化评价和主观评价的位置,将量化评价作为主观评价的参考,强化实地质性评价的指导和协作治理功能,从判断怎么样转向发现为什么、指导如何改进上。

(三)聚焦治理目标,理解并满足社会需求

在强化主观评价的基础上,聚焦教育治理服务对象的需求满足,树立符合需求满足的评价才是有效评价的认识。一些地方的上级政府将下级政府是否及时完成本部门的任务作为重要指标,而其中有些任务并不符合基层实际情况,这类评价指标往往是基层负担的主要来源。一切教育管理和评价工作应服务于学校教育教学的开展,一些乡村学校、薄弱学校对扩大教室面积并没有很高的需求,但迫切需要更新补充信息化设施,评价工作应反映这些实际需求,而不是奉报表上的百名学生拥有终端数或者计算机教室面积为圭臬。

田发等的研究显示,地区经济发展水平、城镇化率、城镇人口规模以及社会治理财政支出是影响社会治理能力的主要因素。政府部门更在意同兄弟部门的锦标竞争以借此赢得稀缺的表彰、晋升机会。为确保公平竞争,鼓励基础水平不一的地方政府均能够努力工作,统一内容和标准的排名评价应转向基于共同价值标准的个性化发展性评价,重点评价每个地方的教育项目和任务制定是否符合当地实际,以及基于自身背景和社会需求的发展目标完成情况。

(四)引导管理变革,从事项叙事走向要素叙事

依法治教背景下,对地方政府教育工作的评价应以教育法的落实为根本目标,而教育法概括了教育工作的基本要素和运行规律,以教育法规定的主要内容为评价要素有助于克服当前评价工作的事项性评价过重的缺陷。事项性评价指标要求过于具体,导致指标排斥性较高,有可能遗漏其他需要检查评价的问题,且同一主题领域在不同时期、不同地域涉及的具体问题有所差异,事项性评价在细节上的统一要求会导致评价成本、评价负担和治理成本的提高。例如,学校供餐安全检查要求食堂必须由学校直接运营、要有餐厅等,这个指标间接传导到对教师配置数量、专业方向、校舍建设等的要求。学校教师普遍自认为缺乏管理食堂、保证食品和财务安全的专业能力,学校场地有限的情况下建设餐厅还可能挤占功能教室的配置。获得国际社会广泛认可的日本学校供餐管理并未要求学校直接运营食堂和设置独立餐厅,其供餐卫生和营养的高水平源于全社会对食品安全的高要求。各地学校历史形成的供餐模式多样,有的学校直接运营效果良好,也有的学校受益于企业的专业化、规模化供餐。评价工作应以学生健康安全这一法律规定的要素为目标进行整体性评价,在内容上不限于供餐安全并关注一切与学生安全有关的问题从而实现防患于未然;减少一刀切评价对地方差异性和自主性带来的困扰,如食品安全责任可由学校承担也可由企业承担。以要素为基础的整体性评价不是事项细节的相加,评价要点只是要素评价的参考而不必面面俱到。整体性评价视评价对象为有机整体,通过综合考虑要素、要素间的联系与协同形成最终的整体性判断。与传统分析性评价相比,避免了过分分解评价对象的系统性偏差。萨德拉(Sadler)提出了整体性评价方法,即先形成整体印象,再逆向推导印象的形成过程,这种学生学业评价方法同样适用于政府评价。要素式整体性评价遵循教育规律,要求教育治理重视常规性投入和日常精细化管理。例如,关注仪器设备指标值合格却难以使用、校舍面积数值合格但卫生水平不高、生均图书数值合格却缺乏教师用学科专业期刊等现象。因此,政府教育工作评价应从具体事项的执行转向重点关注依法治教下的科学管理、民主管理问题,从而引导地方政府在具体事项上的规范治理。

(五)改革问责定位,强化以评促改

社会认知通常把问责狭隘地等同于经济、行政等手段的奖惩,认为没有问责压力时评价对象就不会认真对待评价要求。联合国教科文组织把问责定义为,一个旨在帮助个人和机构履行其职责并实现其目标的过程,通过对政府的职责完成情况的描述与评价,为管理、决策、规划提供依据。信息公开带来的压力也是问责的一种重要形式,例如,浙江省某地的区县党委书记对教育工作进行公开述职,山东省电视问政等措施,虽没有分数排名但来自社会公众的关注带来的问责压力更大。近期,英国苏格兰教育局以督学实地协作式督导的方式完成了对下属地区战略领导力、法定职责履行情况、内部运作机制的评估,考察其在提供优质服务并持续改进教育质量方面的成就,并向皇家督导团和社会公布了督导报告以接受全面监督。政府教育工作评价可以参考更为成熟的学校督导模式,探索周期性全员轮流评价模式,也可以探索区县主要领导任期结束评价模式,以及风险地区重点评价模式等,弱化统一排名下的各类奖惩,服务不同的问责目的,强化评价的指导改进功能。

来源|《中国考试》2026年03期

作者|任春荣(中国教育科学研究院教育评价与督导研究所研究员)