论文部分内容阅读
袁 莉 译
编者按:这篇文章是Nuffield Foundation 资助的 “为了未来的评价系统”课题的研究成果。这个研究课题是由评价改革小组2003 年建立的,由剑桥大学教育学院的Wynne Harlen领导其他核心组成员①完成,旨在从对在校学生的终结性评价的研究和实践中寻找证据,从而获取使学生从终结性评估中收益的教学方法。怎样发挥教师在终结性评价中的作用是这个课题的重点。有关这个课题的详细信息和评价改革小组的其他活动及研究成果,请访问其网站www.assessment-reform-group.org
[关键词] 教师;终结性评价;作用
[中图分类号] G632.471[文献标识码] A[文章编号] 1672-1128(2007)10-0014-07
一、综 述
评价和考试对年轻一代的生活和工作有着重大的影响。学校所作出的决定,特别是国家统一考试的成绩极大地影响着学生的就业机会和前途。当这些考试和考评的结果被用来评判老师和学校时,也影响着教师的教学手段。考虑到考试和评价的重要性,终结性评价应该尽可能准确,并以正确的方式去反映和影响学生在校的学习是非常必要的。
目前,大量的研究结论表明,教育系统强烈地依赖于考试成绩有许多缺陷,特别是用这种方式来考察学生学习的可信程度,即正确性和可靠性值得怀疑。本文提出,恰当地运用教师判断能够减少终结性评价对教学所带来的负面影响。同时也注意到了在运用教师评价系统时应该考虑到的许多问题。特别强调了几个方面:对教师的判断必须有强有力的和持续的质量保证及监控程序;提供衡量发展的标准去指导以达到特定的目标而进行的学习;教师可以得到精心设计的评价学生的技能和理解能力的考核任务,从而帮助他们在作出判断的时候考虑到全方位的学习目标;教师岗前和在岗培训应该提高他们对不同评价目的的理解和运用能力。终结性评价要与形成性评价相结合,使其透明,并且老师的判断要以事实为依据。所有的这些条件都具备了才能得出可信的结论。
另外,为了避免通过一锤定音的终结性评价去评估教师和学校所带来的负面影响,特别强调衡量学校优劣的标准不能单纯地依赖于从学生终结性评价中得到的数据,考察学生成绩的标准应该来自方方面面所收集的证据而不是每个学生的考试结果。这对那些制定评价政策和实施这些政策的人都具有重要的指导意义。
二、前 言
各种不同的评价方式被广泛地运用在教育中。为了改善和提高教学评价,最引人瞩目的是被称作教学过程中的评价(形成性评价)。这里主要讨论的是对教学效果的评价(终结性评价),一般为了总结学生在一定的阶段所学到的知识和掌握的技能以便汇报学生的学习成绩和进度。
2002年,英国的一些评价政策里已经显示出要有选择性地使用外部的考试作为对学生的终结性评价。例如,英格兰的政策已经调整,倾向于在终结性评价中强调以教师为中心和发挥他们作用。威尔士、苏格兰和北爱尔兰的改革,已从2005年夏季开始,赋予小学年龄段老师对学生进行评价的责任。
在威尔士,小学低年龄段的考试(7岁)已经在2002年就取消了,威尔士政府宣布,从2004年夏天起废除对11岁和14岁年龄段学生的国家考试。在苏格兰,教师从电子库里抽取国家考试试题去帮助他们对学生的成绩作出判断,但是,政府不再统计考试成绩。北爱尔兰政府决定停止阶段性的考试和小学到中学的升学考试,而引入以教师评价为基础的学生个人档案。个人档案能让父母随时了解他们的孩子的学习进度和成绩,同时也为学生升中学和大学提供依据。
在2005年宣布的改革中,英格兰教育部长Stephen Twigg 说,他和他的同事将“给予教师完全的信任”。他强调,在英国4700所学校进行的实验表明,在小学低年龄段(7岁)尽管教师开始仍需用考试作为终结性评价过程中的一部分,但教师评价已经明显得以“强化”。英格兰学历和课程委员会的执行主席在讲话中指出:“与其他的竞争对手相比,我们国家已经有了实施严格的教师评价的基础,我们可以通过教师平时系统收集证据去得到比目前的评价更可靠的结果。”他预测,对11岁和14岁学生外部的终结性考试将被恰如其分的教师评价所取代,但是这个过程至少要花10年。他希望有一天,当必须对学生进行考试的时候,英格兰的教师将可以从考试库中根据需要去选择相应的试题和考核任务。本文表明了一个观点,那就是在尽可能短的时间内推进教师在终结性评价中所肩负的重大责任有其充分的以事实为根据的原因。
当然,教师的终结性评价并不是灵丹妙药,也会存在一些问题。但是它在许多方面优于以外部考试为标准的评价体系。这里提出的观点是以大量的研究证据为基础的,有的所引用的研究证据已经在这里给出了参考书目,有的引用了网上评价改革小组的著作和文章。本文首先探讨了运用教师评价作为终结性评价目的的优点和缺点以及为了确保它所提供的信息具有较高的可信任性(可靠性和有效性的结合)所需要采取的行动;然后总结了以考试和测验为基础的终结性评价系统的一些问题和怎样才能确保终结性评价所提供的信息能够满足它所要面对的不同的用途。本文对于制定和实施教育政策的人具有重要的指导意义。虽然这里使用的是“中小学生”和“学校”这些词,但是这里的一些观点和意义与其他教育院校的学生也是相关的。
三、用教师的评价作为终结性评价的
优势和不足
通过对学生学习的评价去总结学生的成绩有着不同的目的,其多样性表现在从非正式的记录学习过程到一锤定音的证书(见表1)以及贯穿于从小学到成人教育的各个阶段。同时进行评价的方式也是多种多样的。 这里主要讨论的是评价方式的采用必须基于所提供的信息符合其目的。
运用教师的评价作为外部终结性评价已经提倡了很长时间了。当我们想一想有效的终结性评价所应该具备的质量标准,这种方式的价值就非常清晰了。与其他目的的评价相同,终结性评价应该具备以下的一些质量要求。
第一是有效性:评价必须覆盖所有的并且只能包括那些与评价目的相关的学生的成绩。第二是可靠性:评价应该精心设计让用户对结果的准确和目的的一致性有信心。第三是冲击性:评价不仅只是衡量表现情况而且还要对教学和学生的学习动机等起到促进作用。评价通常对课程的开设和教学有着强烈的冲击,因此,尽量减少任何的负面影响是非常重要的。第四是可行性:进行终结性评价所需要的资源——教师的时间、专业知识、费用以及学生的用于学习时间——应该与其所提供的价值相符。
教师终结性评价怎样才能成功地满足这四个要求呢?下面,从正反两方面对教师终结性评价的优势与不足进行了比较(见表2)。但是,在我们展开这些争论之前,非常重要的一点就是要对教师的终结性评价有一个明确的定义。从目前教师和专家的讨论来看,它的定义仅限于教师对他们自己的学生的评价。教师终结性评价是教师通过一系列有计划的,系统的方式去收集信息的过程,并基于他们的专业判断去推断学生的学习状况和报告学生在特定时期的成绩。
四、提高教师的终结性评价的可靠性
值得指出的是,研究中发现教师终结性评价中的不足,主要来自那些并没有尝试把教师的评价作为主要角色的项目。从其他把教师的评价作为终结性评价的目的的研究和一些国家的经验来看,已经发现了影响评价的可靠性的条件和可以提高其可靠性的方法。
PACE 课题对英格兰小学的一组学生进行了为期8年的跟踪研究,这项研究开始于英国决定对7岁的学生进行国家统一考试之前。其研究发现自从引入了外部考试以后,教师自己的课堂评价变得更像终结性评价。学生感到在引入考试之前教师的评价帮助他们的学习,但是随后他们注意到老师更加关注考试成绩而不是学习过程。 学生自己开始采取终结性评价的标准去评论他们自己的作业。
七、满足终结性评价目的的需要
1.形成性评估和终结性评估协调统一
考试对形成性评估的负面影响,是强化教师评价的主要原因之一,因此,把二者结合起来是非常重要的。 在课堂教学中,教师能够通过观察、提问,倾听学生的交谈和批改作业去收集学生的信息。在形成性评价中这些信息可以立即用来促进学生的学习或可以储存起来用于去计划将来的学习机会。通过这种方式收集到的信息通常是不确定的,也可能是相互矛盾的,因为众所周知,学生所能做的是受特定环境的影响的。这给终结性评价造成了问题,但对达到形成性评价的目的却是有用的。在为这两个目的服务时,在信息和信息的解释之间需要区别对待。
对于形成性评价而言,信息的解释是相对于一个学生朝着一个特定阶段的学习目标迈进的进度。然后按照什么已经达到了和遇到了什么问题去决定下一步计划。说明的是需要做什么去帮助今后的学习,而不是什么水平和一个学生已经达到的级别。为了满足终结性评估的目的,需要运用一些对所有的学生具有相同含义的常规的标准和总的成绩,如水平和级别。这就是说,如果已经收集的,用作形成性评价的信息被用作终结性评价,必须要满足能够明确报告水平和级别的标准。在终结性评价过程,为了及时掌握反映学生全方位的成绩的最准确的信息,必须动态地考虑不同时间的变化。
反映学生学习成绩的信息既可以用来促进学习也可以用来作为汇报的目的,提供终结性评价并不是对形成性评价的一个总结,而是按照更广泛汇报成绩的标准而进行的重新评估。固定的记录级别和分数不是形成性评估,而是一系列的 “小终结性”评估。当然,对终结性评估必须有必要的质量保证。终结性判断所占的分量越重,越需要严格的质量保证,最好是包括学校间和学校内的判断模式。
采取措施增加以外部需求为目的的教师的终结性评价的可靠性,将不可避免地提高他们以内在的需求为目的的评价能力。然而,为了避免对形成性评价的负面冲击,非常重要的一点是,内部的终结性评估不能过于频繁,不能超过所真正需求的对学习进度和成绩的报告。经常用水平和等级去评价学生意味着他们收到的反馈是评判为主的,鼓励他们把自己与他人进行比较。在这种状况下,教师和学生不会把注意力放到形成性评价上。
2.为了评估的评价
评估存在于各个层次:个人,学校,当地教育部门以及整个国家的教育系统。评估在每个层次的冲击取决于其考虑的信息的类型,用来判断其效果的标准和评判之后采取的行动。如果评估的信息是为了其它的终结性评价的目的而收集的,那它是不可能为评估的目的服务的。通过学生达到某个水平的百分比来对学校进行判断的不足如下:其结果不可能反映一所学校所努力去实现的全方位的教育成果;忽视了对“边缘”学生的注意;鼓励以通过考试和测验为主的狭窄的需要。
评估最好以学生全面的成绩和学习行动的信息为基础,根据学校的环境和条件去作出判断。因此,学校应该提供有关课程、教学方式,以及相应的学生的背景和过去的学习情况等方面的信息。在学校自我评估中有一些很好的例子。
3.为了系统的监控的评价
就教育系统而言, “监控”所指的是学生的学业成绩,教育和教学等方面的变化。它所关注的通常是 “标准”是否提高了,降低了或者是保持在原有水平。虽然它所用的信息包括学生的成绩,但是它的目的是为了帮助制定和完善相应的政策和实践,而不是对每个学生进行评判。学校一级的监控最好是通过自我评估来进行,同时收集其他能够对学生的评价数据进行解释的信息。尽管整个系统每年的变化不可能有太大的意义,但是一定时期的发展趋势可以提供非常有用的信息。
系统监控的价值依赖于所收集的各个方面的信息。英格兰的方法是收集每个学生在国家统一考试的成绩。为了确保督察的有效性,需要收集从观察学生的实际操作技能和各种评价的结论等全方位的信息。
收集已有成绩的方式具有其成本优势,但必须取决于是否能够提供有用的和相关的信息,如用中学最后阶段的考试去判断整个国家的教育发展情况。同样的,建立和运作覆盖各个方面的教育成果的普查的花费必须取决于能否给政策决策者和实践者提供详细的有用的信息。把监控从个体学生的表现中分离出来,可以避免集中收集每个学生的分数。这将消除对“一锤定音”的考试的“需要”,能够确保评价不再被考试所限制,更重要的是,教什么不再被考什么所限制。在一些国家进行的持续的,定期的对部分学生的抽样调查证实了这种作法的价值。
八、结 论
本文解释了为什么以考试为主的评价系统所提供的学生的成绩,其信息的有效性和可靠性是不足的。究其原因,部分是由于所评价的知识和能力,部分是由评价的方法和怎样去用这些结果。其后果是限制了课程和教学方式以及削弱为了促进学习的评价的实施。同时它也导致了终结性评价太过频繁。为了减少这些负面影响,终结性评价应该设计成为为特殊的目的提供信息,并且只能当学习过程中需要总结和评估才进行。其它的时间教师应该集中于形成性评价。
1.采用教师终结性评价中需要注意的问题
从那些已经用了和增加使用恰当的教师终结性评价的教育系统所提供的信息来看,这种方式并没有什么负面影响。但是,必须承认这种方式需要采取一系列步骤去确保教师终结性评价所提供的学生成绩的信息是可靠的,这是一个巨大的挑战。关键的几点如下:(1)需要对教师的判断有一个强有力的和持续的质量保证和控制程序,以确保教师终结性评价能够对学生的学习提供有效的和可靠的评估。(2)教师的岗前和在职培训应该发展教师对不同的评价目的的理解和技能,强调教师评估中存在的潜在的偏见,从而帮助教师减少评估对学生造成的负面影响。(3)必须投入精力和资源去制定达到一个特定目标的学习进度,并能够运用到各种活动中去的发展标准。(4)教师应该得到设计得比较完善的方案去评价学生的技能和理解,这能帮助他们在考虑全方位的学习目标的基础上作出判断。(5)程序应该是非常透明的,教师的判断要以事实为依据。(6)终结性评价必须融入形成性评价的程序中,应该通过合理的设计去减少教师和学生的负担。
另外,为了避免用“一锤定音”的终结性评价去评估教师和学校所带来的负面影响:学校系统的评定不能单纯地依赖,或主要来自于终结性评价的数据。这些数据应该放在反映学校的其它成就的指数的环境中去报告和解释。监测学生所达到的标准应该从各种信息中得来而不是每个学生的考试成绩。教师评价在一个教育系统的作用是以一定数量的学生为样本去收集各方面的信息。
2.采用教师终结性评价的意义
这些结论对那些在国家和地区一级制定方针,政策的,对那些在学校和大学里实施评价政策的,对顾问,督学和对师范教育工作者都有重要的指导意义。由于实施是以政策为依据,所以这种改变要求那些在实践中具体操作的人真正地理解这些政策,并采取相应的行动,特别是包含着信任和责任。因此,下面所归纳的对政策决策者和实施者的意义是没有等级区别的。
(1)对国家和地区一级的决策者的意义
认识到目前在国家和学校各个层次上以考试为基础的终结性评价政策,所投入的经费和时间并没有得到相应的价值的信息。通过教师判断的模式去报告学生的成绩,从而取代现有的国家考试,把节省下来的一些时间和经费投入到提高教学的质量中去。回顾和检查教师评价在考核16至18岁的学生时的作用。提倡在教育系统进行为什么需要改革和怎样进行改革的公开讨论。对任何新的以教师判断为基础的终结性评估系统应该给予至少两年的实验和评估期,以及同样的时间段去宣传和培训教师。评估学校和鼓励自我评估要以各个方面的指标为依据,而不只是学生的成绩,降低“一锤定音”的外部考试所带来的负面影响。建立一个以国家监测为目的的抽样学生成绩系统,因此,在降低全面考试的负担的同时增强信息的广度和相关性。
(2)对学校管理层的意义
制定一项任何时候都以评价去支持和促进学习的学校评价政策,并只在必要时为了检查和报告进度才需要终结性评价。对所有终结性评价有质量保证的安排,包括任何教师给予的考试,使学校能够基于可靠的信息对学生的进度作出决定。确保家长理解评价怎样帮助学生学习和怎样的标准是被用来报告一年中各个阶段的进度。抵制考试的硬指标所带来的压力,鼓励用能够说明学生学习情况的各种类型的信息。通过模式化给教师评价提供质量保证和时间保障。
(3)对教师的意义
确保评价总是用来去帮助学习,当需要一个终结性评估报告时,最好要对照相应的标准和对证据的可靠性进行判断。把学生包括在自我评价的程序中,帮助他们理解以报告为目的,去评价他们的学习情况的标准,以及终结性判断是怎样作出的。参与模式化的终结性判断和其他质量保证程序。只在最合适的时候用考试,而不是例行公事。
(4)对督学和顾问的意义
检查学校的政策和实践以确保评估是用于教学的过程中而不是被终结性的考试和任务所代替。鼓励运用能说明学生各方面的成绩的信息。确保将评价纳入教师的继续教育中,以满足那些需要这方面知识的教师的需要。回顾和检查评价是否完全合适和其它质量保证程序, 以及哪些对教学是有利的。帮助学校发展以各种评价方式为基础的自我评估行动计划,而不只停留在学生的成绩上。
(5)对岗前和在职专业发展课程提供者的意义
确保课程的设计中提供充足的时间去讨论评价的不同目的和使用已有的评估数据;让参训者去辨别,举例和评估不同的收集学生成就的信息的方式;分享设计与特殊的学习目标相关的评价标准的经验;思考评价中存在偏见事例和其它问题的根源,以及如何把它们最小化。
注释
①评价改革小组的核心成员:Mr.David Bartlett,Co-ordinator for Assessment,Birmingham City Council Children and Young Person Services;Professor Paul Black,King’s College,University of London;Professor Richard Daugherty,University of Wales,Aberystwyth;Dr.Kathryn Ecclestone,University of Exeter;Ms.Janet English,Head Teacher,Malvern Way Infant and Nursery Schools,Croxley Green, Hertfordshire;Professor John Gardner,Queen’s University, Belfast;Professor Wynne Harlen,University of Bristol,ASF project director Ms Carolyn Hutchinson Head of Assessment Branch,Scottish Executive Education Department;Professor Mary James,Institute of Education,University of London;Mr.Martin Montgomery,Assessment Development Manager,Council for the Curriculum, Examinations and Assessment,Northern Ireland;Dr.Paul Newton,Principal Assessment Researcher,Regulation and Standards Division,Qualifications and Curriculum Authority;Dr.Catrin Roberts,Assistant Director,Nuffield Foundation;Mr. Jon Ryder Teacher,Lord Williams’s School,Thame,Oxfordshire;Professor Judy Sebba,University of Sussex;Dr.Gordon Stobart,Institute of Education,University of London;Ms Anne Whipp Curriculum and Teacher Assessment Manager,ACCAC,(the Qualifications,Curriculum and Assessment Authority for Wales).
译者系英国女王大学教育学院博士
(责任编辑 潘静波)
编者按:这篇文章是Nuffield Foundation 资助的 “为了未来的评价系统”课题的研究成果。这个研究课题是由评价改革小组2003 年建立的,由剑桥大学教育学院的Wynne Harlen领导其他核心组成员①完成,旨在从对在校学生的终结性评价的研究和实践中寻找证据,从而获取使学生从终结性评估中收益的教学方法。怎样发挥教师在终结性评价中的作用是这个课题的重点。有关这个课题的详细信息和评价改革小组的其他活动及研究成果,请访问其网站www.assessment-reform-group.org
[关键词] 教师;终结性评价;作用
[中图分类号] G632.471[文献标识码] A[文章编号] 1672-1128(2007)10-0014-07
一、综 述
评价和考试对年轻一代的生活和工作有着重大的影响。学校所作出的决定,特别是国家统一考试的成绩极大地影响着学生的就业机会和前途。当这些考试和考评的结果被用来评判老师和学校时,也影响着教师的教学手段。考虑到考试和评价的重要性,终结性评价应该尽可能准确,并以正确的方式去反映和影响学生在校的学习是非常必要的。
目前,大量的研究结论表明,教育系统强烈地依赖于考试成绩有许多缺陷,特别是用这种方式来考察学生学习的可信程度,即正确性和可靠性值得怀疑。本文提出,恰当地运用教师判断能够减少终结性评价对教学所带来的负面影响。同时也注意到了在运用教师评价系统时应该考虑到的许多问题。特别强调了几个方面:对教师的判断必须有强有力的和持续的质量保证及监控程序;提供衡量发展的标准去指导以达到特定的目标而进行的学习;教师可以得到精心设计的评价学生的技能和理解能力的考核任务,从而帮助他们在作出判断的时候考虑到全方位的学习目标;教师岗前和在岗培训应该提高他们对不同评价目的的理解和运用能力。终结性评价要与形成性评价相结合,使其透明,并且老师的判断要以事实为依据。所有的这些条件都具备了才能得出可信的结论。
另外,为了避免通过一锤定音的终结性评价去评估教师和学校所带来的负面影响,特别强调衡量学校优劣的标准不能单纯地依赖于从学生终结性评价中得到的数据,考察学生成绩的标准应该来自方方面面所收集的证据而不是每个学生的考试结果。这对那些制定评价政策和实施这些政策的人都具有重要的指导意义。
二、前 言
各种不同的评价方式被广泛地运用在教育中。为了改善和提高教学评价,最引人瞩目的是被称作教学过程中的评价(形成性评价)。这里主要讨论的是对教学效果的评价(终结性评价),一般为了总结学生在一定的阶段所学到的知识和掌握的技能以便汇报学生的学习成绩和进度。
2002年,英国的一些评价政策里已经显示出要有选择性地使用外部的考试作为对学生的终结性评价。例如,英格兰的政策已经调整,倾向于在终结性评价中强调以教师为中心和发挥他们作用。威尔士、苏格兰和北爱尔兰的改革,已从2005年夏季开始,赋予小学年龄段老师对学生进行评价的责任。
在威尔士,小学低年龄段的考试(7岁)已经在2002年就取消了,威尔士政府宣布,从2004年夏天起废除对11岁和14岁年龄段学生的国家考试。在苏格兰,教师从电子库里抽取国家考试试题去帮助他们对学生的成绩作出判断,但是,政府不再统计考试成绩。北爱尔兰政府决定停止阶段性的考试和小学到中学的升学考试,而引入以教师评价为基础的学生个人档案。个人档案能让父母随时了解他们的孩子的学习进度和成绩,同时也为学生升中学和大学提供依据。
在2005年宣布的改革中,英格兰教育部长Stephen Twigg 说,他和他的同事将“给予教师完全的信任”。他强调,在英国4700所学校进行的实验表明,在小学低年龄段(7岁)尽管教师开始仍需用考试作为终结性评价过程中的一部分,但教师评价已经明显得以“强化”。英格兰学历和课程委员会的执行主席在讲话中指出:“与其他的竞争对手相比,我们国家已经有了实施严格的教师评价的基础,我们可以通过教师平时系统收集证据去得到比目前的评价更可靠的结果。”他预测,对11岁和14岁学生外部的终结性考试将被恰如其分的教师评价所取代,但是这个过程至少要花10年。他希望有一天,当必须对学生进行考试的时候,英格兰的教师将可以从考试库中根据需要去选择相应的试题和考核任务。本文表明了一个观点,那就是在尽可能短的时间内推进教师在终结性评价中所肩负的重大责任有其充分的以事实为根据的原因。
当然,教师的终结性评价并不是灵丹妙药,也会存在一些问题。但是它在许多方面优于以外部考试为标准的评价体系。这里提出的观点是以大量的研究证据为基础的,有的所引用的研究证据已经在这里给出了参考书目,有的引用了网上评价改革小组的著作和文章。本文首先探讨了运用教师评价作为终结性评价目的的优点和缺点以及为了确保它所提供的信息具有较高的可信任性(可靠性和有效性的结合)所需要采取的行动;然后总结了以考试和测验为基础的终结性评价系统的一些问题和怎样才能确保终结性评价所提供的信息能够满足它所要面对的不同的用途。本文对于制定和实施教育政策的人具有重要的指导意义。虽然这里使用的是“中小学生”和“学校”这些词,但是这里的一些观点和意义与其他教育院校的学生也是相关的。
三、用教师的评价作为终结性评价的
优势和不足
通过对学生学习的评价去总结学生的成绩有着不同的目的,其多样性表现在从非正式的记录学习过程到一锤定音的证书(见表1)以及贯穿于从小学到成人教育的各个阶段。同时进行评价的方式也是多种多样的。 这里主要讨论的是评价方式的采用必须基于所提供的信息符合其目的。
运用教师的评价作为外部终结性评价已经提倡了很长时间了。当我们想一想有效的终结性评价所应该具备的质量标准,这种方式的价值就非常清晰了。与其他目的的评价相同,终结性评价应该具备以下的一些质量要求。
第一是有效性:评价必须覆盖所有的并且只能包括那些与评价目的相关的学生的成绩。第二是可靠性:评价应该精心设计让用户对结果的准确和目的的一致性有信心。第三是冲击性:评价不仅只是衡量表现情况而且还要对教学和学生的学习动机等起到促进作用。评价通常对课程的开设和教学有着强烈的冲击,因此,尽量减少任何的负面影响是非常重要的。第四是可行性:进行终结性评价所需要的资源——教师的时间、专业知识、费用以及学生的用于学习时间——应该与其所提供的价值相符。
教师终结性评价怎样才能成功地满足这四个要求呢?下面,从正反两方面对教师终结性评价的优势与不足进行了比较(见表2)。但是,在我们展开这些争论之前,非常重要的一点就是要对教师的终结性评价有一个明确的定义。从目前教师和专家的讨论来看,它的定义仅限于教师对他们自己的学生的评价。教师终结性评价是教师通过一系列有计划的,系统的方式去收集信息的过程,并基于他们的专业判断去推断学生的学习状况和报告学生在特定时期的成绩。
四、提高教师的终结性评价的可靠性
值得指出的是,研究中发现教师终结性评价中的不足,主要来自那些并没有尝试把教师的评价作为主要角色的项目。从其他把教师的评价作为终结性评价的目的的研究和一些国家的经验来看,已经发现了影响评价的可靠性的条件和可以提高其可靠性的方法。
PACE 课题对英格兰小学的一组学生进行了为期8年的跟踪研究,这项研究开始于英国决定对7岁的学生进行国家统一考试之前。其研究发现自从引入了外部考试以后,教师自己的课堂评价变得更像终结性评价。学生感到在引入考试之前教师的评价帮助他们的学习,但是随后他们注意到老师更加关注考试成绩而不是学习过程。 学生自己开始采取终结性评价的标准去评论他们自己的作业。
七、满足终结性评价目的的需要
1.形成性评估和终结性评估协调统一
考试对形成性评估的负面影响,是强化教师评价的主要原因之一,因此,把二者结合起来是非常重要的。 在课堂教学中,教师能够通过观察、提问,倾听学生的交谈和批改作业去收集学生的信息。在形成性评价中这些信息可以立即用来促进学生的学习或可以储存起来用于去计划将来的学习机会。通过这种方式收集到的信息通常是不确定的,也可能是相互矛盾的,因为众所周知,学生所能做的是受特定环境的影响的。这给终结性评价造成了问题,但对达到形成性评价的目的却是有用的。在为这两个目的服务时,在信息和信息的解释之间需要区别对待。
对于形成性评价而言,信息的解释是相对于一个学生朝着一个特定阶段的学习目标迈进的进度。然后按照什么已经达到了和遇到了什么问题去决定下一步计划。说明的是需要做什么去帮助今后的学习,而不是什么水平和一个学生已经达到的级别。为了满足终结性评估的目的,需要运用一些对所有的学生具有相同含义的常规的标准和总的成绩,如水平和级别。这就是说,如果已经收集的,用作形成性评价的信息被用作终结性评价,必须要满足能够明确报告水平和级别的标准。在终结性评价过程,为了及时掌握反映学生全方位的成绩的最准确的信息,必须动态地考虑不同时间的变化。
反映学生学习成绩的信息既可以用来促进学习也可以用来作为汇报的目的,提供终结性评价并不是对形成性评价的一个总结,而是按照更广泛汇报成绩的标准而进行的重新评估。固定的记录级别和分数不是形成性评估,而是一系列的 “小终结性”评估。当然,对终结性评估必须有必要的质量保证。终结性判断所占的分量越重,越需要严格的质量保证,最好是包括学校间和学校内的判断模式。
采取措施增加以外部需求为目的的教师的终结性评价的可靠性,将不可避免地提高他们以内在的需求为目的的评价能力。然而,为了避免对形成性评价的负面冲击,非常重要的一点是,内部的终结性评估不能过于频繁,不能超过所真正需求的对学习进度和成绩的报告。经常用水平和等级去评价学生意味着他们收到的反馈是评判为主的,鼓励他们把自己与他人进行比较。在这种状况下,教师和学生不会把注意力放到形成性评价上。
2.为了评估的评价
评估存在于各个层次:个人,学校,当地教育部门以及整个国家的教育系统。评估在每个层次的冲击取决于其考虑的信息的类型,用来判断其效果的标准和评判之后采取的行动。如果评估的信息是为了其它的终结性评价的目的而收集的,那它是不可能为评估的目的服务的。通过学生达到某个水平的百分比来对学校进行判断的不足如下:其结果不可能反映一所学校所努力去实现的全方位的教育成果;忽视了对“边缘”学生的注意;鼓励以通过考试和测验为主的狭窄的需要。
评估最好以学生全面的成绩和学习行动的信息为基础,根据学校的环境和条件去作出判断。因此,学校应该提供有关课程、教学方式,以及相应的学生的背景和过去的学习情况等方面的信息。在学校自我评估中有一些很好的例子。
3.为了系统的监控的评价
就教育系统而言, “监控”所指的是学生的学业成绩,教育和教学等方面的变化。它所关注的通常是 “标准”是否提高了,降低了或者是保持在原有水平。虽然它所用的信息包括学生的成绩,但是它的目的是为了帮助制定和完善相应的政策和实践,而不是对每个学生进行评判。学校一级的监控最好是通过自我评估来进行,同时收集其他能够对学生的评价数据进行解释的信息。尽管整个系统每年的变化不可能有太大的意义,但是一定时期的发展趋势可以提供非常有用的信息。
系统监控的价值依赖于所收集的各个方面的信息。英格兰的方法是收集每个学生在国家统一考试的成绩。为了确保督察的有效性,需要收集从观察学生的实际操作技能和各种评价的结论等全方位的信息。
收集已有成绩的方式具有其成本优势,但必须取决于是否能够提供有用的和相关的信息,如用中学最后阶段的考试去判断整个国家的教育发展情况。同样的,建立和运作覆盖各个方面的教育成果的普查的花费必须取决于能否给政策决策者和实践者提供详细的有用的信息。把监控从个体学生的表现中分离出来,可以避免集中收集每个学生的分数。这将消除对“一锤定音”的考试的“需要”,能够确保评价不再被考试所限制,更重要的是,教什么不再被考什么所限制。在一些国家进行的持续的,定期的对部分学生的抽样调查证实了这种作法的价值。
八、结 论
本文解释了为什么以考试为主的评价系统所提供的学生的成绩,其信息的有效性和可靠性是不足的。究其原因,部分是由于所评价的知识和能力,部分是由评价的方法和怎样去用这些结果。其后果是限制了课程和教学方式以及削弱为了促进学习的评价的实施。同时它也导致了终结性评价太过频繁。为了减少这些负面影响,终结性评价应该设计成为为特殊的目的提供信息,并且只能当学习过程中需要总结和评估才进行。其它的时间教师应该集中于形成性评价。
1.采用教师终结性评价中需要注意的问题
从那些已经用了和增加使用恰当的教师终结性评价的教育系统所提供的信息来看,这种方式并没有什么负面影响。但是,必须承认这种方式需要采取一系列步骤去确保教师终结性评价所提供的学生成绩的信息是可靠的,这是一个巨大的挑战。关键的几点如下:(1)需要对教师的判断有一个强有力的和持续的质量保证和控制程序,以确保教师终结性评价能够对学生的学习提供有效的和可靠的评估。(2)教师的岗前和在职培训应该发展教师对不同的评价目的的理解和技能,强调教师评估中存在的潜在的偏见,从而帮助教师减少评估对学生造成的负面影响。(3)必须投入精力和资源去制定达到一个特定目标的学习进度,并能够运用到各种活动中去的发展标准。(4)教师应该得到设计得比较完善的方案去评价学生的技能和理解,这能帮助他们在考虑全方位的学习目标的基础上作出判断。(5)程序应该是非常透明的,教师的判断要以事实为依据。(6)终结性评价必须融入形成性评价的程序中,应该通过合理的设计去减少教师和学生的负担。
另外,为了避免用“一锤定音”的终结性评价去评估教师和学校所带来的负面影响:学校系统的评定不能单纯地依赖,或主要来自于终结性评价的数据。这些数据应该放在反映学校的其它成就的指数的环境中去报告和解释。监测学生所达到的标准应该从各种信息中得来而不是每个学生的考试成绩。教师评价在一个教育系统的作用是以一定数量的学生为样本去收集各方面的信息。
2.采用教师终结性评价的意义
这些结论对那些在国家和地区一级制定方针,政策的,对那些在学校和大学里实施评价政策的,对顾问,督学和对师范教育工作者都有重要的指导意义。由于实施是以政策为依据,所以这种改变要求那些在实践中具体操作的人真正地理解这些政策,并采取相应的行动,特别是包含着信任和责任。因此,下面所归纳的对政策决策者和实施者的意义是没有等级区别的。
(1)对国家和地区一级的决策者的意义
认识到目前在国家和学校各个层次上以考试为基础的终结性评价政策,所投入的经费和时间并没有得到相应的价值的信息。通过教师判断的模式去报告学生的成绩,从而取代现有的国家考试,把节省下来的一些时间和经费投入到提高教学的质量中去。回顾和检查教师评价在考核16至18岁的学生时的作用。提倡在教育系统进行为什么需要改革和怎样进行改革的公开讨论。对任何新的以教师判断为基础的终结性评估系统应该给予至少两年的实验和评估期,以及同样的时间段去宣传和培训教师。评估学校和鼓励自我评估要以各个方面的指标为依据,而不只是学生的成绩,降低“一锤定音”的外部考试所带来的负面影响。建立一个以国家监测为目的的抽样学生成绩系统,因此,在降低全面考试的负担的同时增强信息的广度和相关性。
(2)对学校管理层的意义
制定一项任何时候都以评价去支持和促进学习的学校评价政策,并只在必要时为了检查和报告进度才需要终结性评价。对所有终结性评价有质量保证的安排,包括任何教师给予的考试,使学校能够基于可靠的信息对学生的进度作出决定。确保家长理解评价怎样帮助学生学习和怎样的标准是被用来报告一年中各个阶段的进度。抵制考试的硬指标所带来的压力,鼓励用能够说明学生学习情况的各种类型的信息。通过模式化给教师评价提供质量保证和时间保障。
(3)对教师的意义
确保评价总是用来去帮助学习,当需要一个终结性评估报告时,最好要对照相应的标准和对证据的可靠性进行判断。把学生包括在自我评价的程序中,帮助他们理解以报告为目的,去评价他们的学习情况的标准,以及终结性判断是怎样作出的。参与模式化的终结性判断和其他质量保证程序。只在最合适的时候用考试,而不是例行公事。
(4)对督学和顾问的意义
检查学校的政策和实践以确保评估是用于教学的过程中而不是被终结性的考试和任务所代替。鼓励运用能说明学生各方面的成绩的信息。确保将评价纳入教师的继续教育中,以满足那些需要这方面知识的教师的需要。回顾和检查评价是否完全合适和其它质量保证程序, 以及哪些对教学是有利的。帮助学校发展以各种评价方式为基础的自我评估行动计划,而不只停留在学生的成绩上。
(5)对岗前和在职专业发展课程提供者的意义
确保课程的设计中提供充足的时间去讨论评价的不同目的和使用已有的评估数据;让参训者去辨别,举例和评估不同的收集学生成就的信息的方式;分享设计与特殊的学习目标相关的评价标准的经验;思考评价中存在偏见事例和其它问题的根源,以及如何把它们最小化。
注释
①评价改革小组的核心成员:Mr.David Bartlett,Co-ordinator for Assessment,Birmingham City Council Children and Young Person Services;Professor Paul Black,King’s College,University of London;Professor Richard Daugherty,University of Wales,Aberystwyth;Dr.Kathryn Ecclestone,University of Exeter;Ms.Janet English,Head Teacher,Malvern Way Infant and Nursery Schools,Croxley Green, Hertfordshire;Professor John Gardner,Queen’s University, Belfast;Professor Wynne Harlen,University of Bristol,ASF project director Ms Carolyn Hutchinson Head of Assessment Branch,Scottish Executive Education Department;Professor Mary James,Institute of Education,University of London;Mr.Martin Montgomery,Assessment Development Manager,Council for the Curriculum, Examinations and Assessment,Northern Ireland;Dr.Paul Newton,Principal Assessment Researcher,Regulation and Standards Division,Qualifications and Curriculum Authority;Dr.Catrin Roberts,Assistant Director,Nuffield Foundation;Mr. Jon Ryder Teacher,Lord Williams’s School,Thame,Oxfordshire;Professor Judy Sebba,University of Sussex;Dr.Gordon Stobart,Institute of Education,University of London;Ms Anne Whipp Curriculum and Teacher Assessment Manager,ACCAC,(the Qualifications,Curriculum and Assessment Authority for Wales).
译者系英国女王大学教育学院博士
(责任编辑 潘静波)