学业测量与评价的前沿和趋势

首页 > 教育新闻 > 教育杂谈/1970-01-01 / 加入收藏 / 阅读 [打印]

  随着课程改革的深入以及公众参与意识的增强,人们对各种考试结果是否能够作出科学解释有着越来越高的要求。在这种情况下,仅凭经验出题,想当然地做解释,必然是行不通的——

  ■柯政 本报记者 赵小雅

  日前,由教育部人文社科基地华东师范大学课程与教学研究所主办的“第10届上海国际课程论坛”在华东师范大学举办。来自美国、德国、新西兰、英国以及香港、台湾和高校的课程教学论的专家、学者、一线教育工作者一起,探讨与交流了学业测量与评价的研究。

  学业测量与评价是课程研究领域一个关键问题,在我国,这方面的研究还处于薄弱地位。这次上海国际课程论坛清晰地刻画了当今国际学业测量与评价领域的前沿问题和发展趋势。综合本次国际课程论坛在特邀专家背景、各主题发言内容以及分会场设计等各方面传递出来的信息,可以清晰地看到当前学业测量与评价领域呈现出了“跨学科交流日益紧密”、“重视大规模测评项目的开发与利用”、“强调测评与课程教学的整合”等三个显著的特征和趋势。

  跨学科交流日益紧密

  此次论坛特邀专家的专业背景多样,他们有传统课程与教学论背景的,有心理学背景的,有统计学背景的,甚至有专门研究计算机的专家。这是基于对当今学业测量与评价领域一个重要趋势的清晰把握,即要进一步提升学业测量与评价的专业性,就必须实现跨学科的交流与合作。而特邀嘉宾的主题报告中显示,这种跨学科合作在实践中已经非常活跃。

  为什么学业测量与评价需要跨学科合作?我们不妨以专家们提到的一个具体问题为例,比如,需要出一道数学题目来测量学生是否真的理解了一元一次方程的内容。这个问题看似很简单,但要真出好这道题目,就需要多个学科的知识。首先,需要课程专家来确定,学生在这一阶段对一元一次方程应该了解到何种程度,掌握这个知识的最终目的是什么。其次,数学专家就要分析学生如要成功回答这个问题,需要哪些知识基础,以及需要经历哪些推理步骤。再其次,需要认知心理学家来告诉我们,学生在调用已有知识基础以及进行推理时候的心理认知模型是什么,哪些信息可能会干扰学生的认知加工过程。而在获得了大量学生的解题过程和结果的信息后,又需要统计学专家来帮助构建测量尺度,即哪些题目测量的是高级能力,哪些是测量低级的能力。最后,可能还需要计算机专家的帮助,把这些信息和要求设计成程序,以后就可以用计算机自动根据需要设计和分配题目,从而解决大量目前传统测验模式无法解决的问题。

  以前,我们对测量与评价的科学性要求不高。一线教师或者命题人员根据自己的教学经验,直接参考市面上的一些习题就编制题目,很少会去思考这道题目是否真的在测量学生的一元一次方程的知识,题目是否在难度上超出了我们所期望的范围等问题。随着课程改革的深入以及公众参与意识的增强,人们对各种考试结果是否能够作出科学解释有着越来越高的要求。在这种情况下,仅凭经验出题,想当然地作解释,必然是行不通的。当前,让这么多专家来合作出一道题似乎还有点“奢侈”,但毫无疑问这是一个发展方向,因为要真正把学业测量与评价做专业、做精致,就必然需要跨学科联合攻关。而且从PISA、TIMSS等大型的学业测量与评价项目来看,这种跨学科的合作已经成为一种常态化的工作机制了。

  重视大规模测评项目开发与利用

  此次论坛安排了12场主题报告,其中有6场都是直接涉及大规模测评项目的问题。关注和重视大规模测评项目的开发与利用,是当今学业测评领域另外一个非常突出的特征。所谓大规模测评项目,简单地说就是对大量学生或者教师进行测评的项目。PISA项目就是一个例子,它是由世界经济合作组织(OECD)对全球60多个国家约50万个学生进行阅读、数学和科学素养测试的一个大规模测评项目。与PISA类似的还有TIMSS项目,美国还有一个全国性的测评项目NAEP,它是由美国国会授权,每两年对全国学生进行一次阅读和数学测试的项目。这些大规模测评集合了当今世界最为先进的测评技术和方法。

  为什么这么关注和重视大规模测评项目?从专家的报告中,可以总结出以下几个原因。首先,测评问题越来越需要跨学科专家的联合,但要集合不同领域的顶尖专家来共同攻关成本很高,由于这些大规模测评项目社会关注度很高,经费支持都比较充足,所以,跨学科的联合首先会体现在如PISA等大规模测评项目中。也正是因为如此,学业测评领域的所有新技术和方法一般都会先在大规模测评项目试验,并因此带动整个学业测评领域的专业水平提升。PISA项目对我国命题考试等领域所带来的冲击,以及活跃在国际测评领域的权威专家基本上都有大型测评项目工作或者研发经验的事实,都充分地说明了大型测评项目的“发动机”地位。

  其次,人们日益认识到大规模测评结果具有不可替代的重要教育作用。教育中的很多重要问题,尤其是一些宏观问题,如国家的整体教育质量,都需要大规模测评结果来回答。如果没有大规模测评数据,很多个别性或者局部性的评价和诊断结果就会失去意义。比如,某个学校的内部考试评价虽然是直接针对教学的改进的,但如果没有外部大规模的测评数据,其实是无法知道这些内部考试评价是否真的促进了教学质量的提高,而建立在此基础上的所有经验或教训也就无从谈起了。

  再其次,大规模测评项目会产生巨量数据,对这些数据进行二次分析,可以极大地推动包括学业测评在内的各有关领域的学术进步。每年都有成千上万篇博士论文在使用PISA数据库的数据这一事实,就充分地说明了大规模测评项目对推动基础学术研究的重要性。

  从规模上来说,我国目前在做的中高考、学业水平考试以及全国性教育质量监测项目也毫无疑问都属于大规模测评项目。但与PISA、NAEP等项目相比,无论在测评理论还是测评技术上都要落后很多。如何借鉴国外的先进经验,提升我国大规模测评项目的专业性,进而带动我国学业测量与评价的整体水平,也因此成了本次论坛的一个讨论热点。

  强调测评与课程教学的整合

  国际知名的测量学家、世界心理测量学会主席张华华教授给大会带来的是他近些年一直在思考的一个问题,那就是怎么用计算机自适应诊断性测试来帮助课堂教学。在他看来,如何帮助一线的课堂教学提高质量,这是未来测评领域必须回答的问题。德国PISA项目首席专家、德国卡尔·冯·奥西茨基大学终身教授,在大会上报告的是他近些年对系统层面的教育测评如何促进班级、个体层面的教育评估的思考。纽约州立大学布法罗分校的Ming Ming Chiu教授则向与会者分享了如何借用统计方法来分析日常课堂对话,给大家留下了非常深刻的印象。

  这些大会主题发言都基于一个共同的立场或认识,那就是学业测评的发展其最根本目的还是为了提升日常课程与教学的质量,如果直接决定教育质量的课程与教学质量没有提高,那么测评质量再高也是没有意义的。而且,把学业测评的许多原理和方法应用到课程教学领域,的确可以为我们提供新的分析视角和观点。比如,课堂观察是一个传统的课程教学研究主题,但长期以来,课堂观察主要还是依靠老师的经验判断,科学性和专业性提升很缓慢,而正如Ming Ming Chiu教授所展示的那样,如果我们能借用一些基本的测评原理再加上一定的统计方法,则可以极大地提升课堂观察的科学性和专业性。

  本次论坛还专门设计了一个“课堂评价:如何与课程教学相整合”的分会场。而且这也是诸多分会场中,与会听众最多,发言最积极的一个分会场。这也说明了对大部分与会者来说,他们更关心的还是如何把学业测评与日常具体的课程教学结合起来,如何借用学业测评的原理和方法来提升课程教学的质量。

  • 最新内容
  • 相关内容
  • 网友推荐
  • 图文推荐