重庆两江新区人和小学校学生在进行国际象棋比赛。 张雁飞 摄
安徽省淮北市黎苑小学学生在大棚里帮助种植户采摘成熟的西红柿,体验劳动的乐趣。周方玲 摄
■聚焦中小学生综合素质评价改革系列报道(二)
中共中央、国务院印发的《深化新时代教育评价改革总体方案》在“总体要求”中提出,坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价。在“改革学校评价”中提出,健全学校内部质量保障制度,坚决克服重智育轻德育、重分数轻素质等片面办学行为,促进学生身心健康、全面发展。在现实中,学生综合素质评价与升学挂钩被指过于注重选拔效果,不挂钩则沦为“花架子”,成为形式主义,增值评价的结果往往不被学校和社会认可。那么,在实际工作中该如何健全综合评价?如何改进结果评价,强化过程评价,探索增值评价?
学生综合素质评价不能与教育质量综合评价混为一谈
在我国教育评价改革的国家政策中,存在两个不同类别、不同功能的综合评价。一是《教育部关于推进中小学教育质量综合评价改革的意见》提出“中小学教育质量综合评价”,把学生的品德发展水平、学业发展水平、身心发展水平、兴趣特长养成、学业负担状况等方面作为评价学校教育质量的主要内容。后来发展成为《义务教育质量评价指南》和《普通高中学校办学质量评价指南》关于学生发展质量评价的重点内容和关键指标。二是《国务院关于深化考试招生制度改革的实施意见》提出“探索基于统一高考和高中学业水平考试成绩、参考综合素质评价的多元录取机制”,以及《教育部关于加强和改进普通高中学生综合素质评价的意见》《教育部关于进一步推进高中阶段学校考试招生制度改革的指导意见》等文件中提出的“学生综合素质评价”。
“中小学教育质量综合评价”和“中小学生综合素质评价”,这两个评价改革在日常工作中,经常被不少教育同行混为一谈。弄清它们的区别,才能发挥各自的功能和作用,才能够顺利推进教育评价改革。
一是评价对象不同。中小学教育质量综合评价的对象是区域或者学校,考查的是教育体系的质量,评价对象是团体。中小学生综合素质评价对象是具体的每一个学生,是学校组织对学生的评价。二是评价指标相近而不相同。中小学教育质量综合评价的一级指标是品德发展、学业发展、身心发展、审美或艺术素养、劳动与社会实践等5个维度,若干个二级指标。学生综合素质评价的指标是思想品德、学业水平、身心健康、艺术素养、社会实践5个方面。三是评价方法、技术不同。中小学教育质量综合评价强调的是定量、数据、测试和问卷调查等。基础教育质量监测评价、跨学科监测以及关注非学业的综合评价部分,已经是当今全世界教育质量监测的重要发展趋势。中小学生综合素质评价是对学生全面发展状况的观察、记录、分析,评价的方法和程序是写实记录、整理遴选、公示审核、形成档案等,可见,学生综合素质评价强调的是写实记录,显然是以定性的事实为主。四是评价的功能和用途不同。中小学教育质量综合评价属于问责制评价,其功能是保障质量底线和确保教育公平,纵观全球,教育领先的国家一般都制定了学习标准及与之相关的问责制与评价机制,用于监测教育成就。学生综合素质评价的功能、用途在于:一是帮助学生长善救失;二是高中学校要将学生综合素质档案提供给高校招生使用,初中学校要提供给高中学校招生使用。
初中生和高中生的综合素质评价尤其要做到真实可信
早在10多年前,经合组织负责国际学生评估项目(PISA)测试的官员和专家就曾表示,如果PISA测试不进行国际排位,参与的国家、地区重视程度明显降低。监测评价结果的运用,高利害容易导致失真,无利害不被重视,难以发挥作用,中小学教育质量综合评价结果低利害使用是现实中合理选择。例如,四川省成都市就将品德、学业、身心发展、艺术素养、劳动实践监测评价结果用于考核区市县教育工作,属于低利害运用,成为贯彻落实《义务教育质量评价指南》的成功案例。
大学和高中的招生录取是高利害的。初中、高中学生综合素质评价所形成的写实记录档案,经历了“写实记录、整理遴选、公示审核、形成档案”等程序,其结果应当是真实可信的,尤其要强调使用电子档案与学生学籍号绑定,每个学期公示审核、形成档案后,学校立即提交上传学籍网络。这样学校就没有修改作假的机会,并且电子学籍系统不能随便修改信息,合理的修改必须有审批程序和修改的电子记录痕迹。大学招生和高中招生可以依据这些简要、真实的写实记录,由录取学校去制定评分标准,对学生量化评分,或者评定出综合等级,供录取时使用。需要提醒的是,下级学校对学生的综合素质评价等级,宜作毕业使用,该等级不宜作升学使用。这样方可避免下一级学校弄虚作假和营私舞弊。
在义务教育课程改革的初期,全国曾开展过初中学生综合素质评价等级与高中录取挂钩。当时有初中学校作了假,特别是学生学业考试成绩达到示范性普通高中录取分数时,而事先评定的综合素质等级没有达到,一些初中学校窜改了对学生事先评定的综合素质评价等级。后来这项制度在许多地方叫停了。如果再走过去的回头路,这样下去,综合素质评价非但没有帮助发展学生的素质,反而会成为弄虚作假、不诚信的诱因。
优化增值评价,关注学生的努力程度和进步表现
增值评价是指学生在学力、生活、情感、社会性发展等方面,在通过接受一定阶段的教育后,在各自起点或基础上进步、发展、成长、转化的“幅度”,并以此对学生个体发展和学校效能进行价值判断的评价方法,这和学生综合素质评价改革是相一致的。在学校教学质量评价与质量管理中,不同生源学校或不同生源班级学生教学质量比较是一大难题。用结果评价,对生源差的学校、班级不公平,这是不争的事实。用增值评价,在激励薄弱学校发展、比较同类学校进步幅度等方面具有重要价值,但目前常用的增值评价方法遭遇了不少挑战,比如,优质生源学校因其上升空间有限而被低评(称之为增值性评价的“天花板效应”)、薄弱生源学校虽然增幅较大却可能仍然没达标等,新的不公平问题出现了。
综上,需要对增值评价进行优化,保留其鼓励进步的发展性评价理念,克服其计算方法中对优生进步幅度小考虑不周的缺点。“给定的”学生特征,例如社会经济地位和学习能力倾向,对学生成就有很大的影响。那么,基于学生的学习能力来考虑学生学习成就评价,把生源的核心特征“学习能力倾向”这一变量控制起来,就可以实现相对更加公平的教育质量评价比较。可以引入“学习能力倾向”这一变量,计算单位能力的学习成绩值,简称“绩能系数”,以此评价比较学校、教师的教学效能。借鉴美国差别能力倾向测验(Differential Aptitude Test,DAT)的经验,将学习能力分为1—9个水平等级,由于每个水平等级的单位能力成绩值不相等,学习能力水平等级越高,其单位能力的成绩值越低,这与“优生”上升空间相对较小是一致的,在同能力等级比较学习成绩是合理的,这就排除了生源质量对教学成绩的影响。在实际分析中,对于给定的评价对象群体,可以将学习能力值、学科成绩通过标准化处理,转化为无量纲的纯数值,计算出标准化的绩能系数,让不同能力等级的成绩值、不同考试难度的成绩等,均可进行评价比较。如此,分析结果不仅可以评价教学质量、教学效能,还能精准分析学情,可以分析校内各班各学科,可以用于小学、初中、高中的教学评价。
标准化后的单位学习能力的成绩值即“绩能系数”,可以用来公平比较生源不同的学校、班级各科成绩、总成绩,克服了结果评价对生源差的学校或班级不公平,增值评价对生源好的学校或班级不公平的矛盾。“绩能系数”关注的是学生潜能开发的优劣而不是绝对成绩的高低,评价的不是成绩好坏,而是教学效能的高低。使用“绩能系数”对所有班级教师教学业绩公平比较,形成公平竞争氛围,提高学校管理效能,促进教学质量提升。
(作者系中国教育学会评价部研究员)