APP下载

以表现性评价推进区域校本研修
——以杭州市余杭区的实践为例

2023-12-29翁逸蓉徐志平林荣凑浙江省杭州市余杭区教育发展研究学院

教学月刊(中学版) 2023年35期
关键词:余杭区表现性研修

翁逸蓉 徐志平 林荣凑|浙江省杭州市余杭区教育发展研究学院

在校本研修的层级管理和实施链条中,县或区级校本研修管理部门(以下简称“区域管理部门”)的评价行为,将会深刻影响各校校本研修的内容、方式和效果。尽管周文叶教授早就提出“开展基于表现性评价的教师研修”[1],但毋庸讳言,限于知识、想象与行为惰性,表现性评价用于教师研修领域的还很少见,用于区域校本研修评价的更是稀缺。考虑到规避校本研修传统考评的问题,自2019年8月始,杭州市余杭区打造以实践情境、常规活动、特色培育、团队建设为内涵的校本研修SCTT(取“实”“常”“特”“团”拼音的首字母组合而成)样式,引入表现性评价技术,四年来极大改变了区域校本研修的生态,得到全区教师和校本研修管理者的好评。

一、当前校本研修区域考评存在的问题

笔者通过中国知网检索,从200多篇以“区域校本研修”为主题的文献中,查得3篇内含考核方案的论文,其中《区域校本研修质量标准建设的探索》[2]一文最具学理性、实践性。作者建构了校本研修评价表(表1所示为其局部),由此出发可以认识校本研修传统考评存在的问题。

表1 校本研修评价表(局部)

表1中的“评价内容”可以理解为一级指标(也是评价维度),“关键要素”可以理解为二级指标,“具体要求”则是对二级指标最优特征的描述。这个校本研修评价表虽是同类评价标准的佼佼者,但从评价角度看,依然存在五大问题。

第一,评价项目面面俱到,未能凸显关键指标。表1所示仅是评价表的一部分,而整个评价表包括研修目标、研修内容、研修途径、研修方式、研修管理、研修保障、特色创新等7 个一级指标、11个二级指标,涉及校本研修的方方面面。事实上,大而全的指标会掩盖最需测查的东西,影响评价表的使用者集中精力区分优劣等级。

第二,偏好百分制,得分的解释力差。国人对评价有着强烈的百分制偏好,且以60 分为及格。如上述评价表,满分100分,评价等第分为A、B、C、D四档。有时1分之差,将分属两个档次,评价者很难对1分之差作出令人信服的解释。

第三,特征描述宽泛,效度和信度受限。从方案设计者来说,表1中“具体要求”已尽力揭示评价项目的最优特征。然而,实际操作时,即使有配套的评分细则,也难以确认怎样算“研修目标明确”,所以效度存疑,同时不同评价者的理解会不一致,所以信度也必然不高。

第四,脱离真实情境,极易滋生形式主义。评价是基于证据的推论,像表1这样的评价表,被评价者在迎检时需要提供多种书面材料。之后貌似档案袋式的评价,会依据一份校本研修领导小组的名单,得出“领导重视,职责明确”的结论,极易滋生文牍主义、形式主义。

第五,评分的反馈难,无助于后续的改进。由于上述原因,评分的主观模糊性极大,要作出明确、清晰的反馈难,工作量又大。最后反馈给被评价者的信息往往只是一个分数、一个等级,或寥寥几句未必着边际的口头或书面评语。

二、在校本研修考评中引入表现性评价的意义

表现性评价是舶来品,在我国曾有不同的译名,如“真实性评价”“实作评估”等。《普遍高中语文课程标准(2017年版2020年修订)》与《义务教育课程方案(2022年版)》均采用了“表现性评价”这一术语,但国内外至今尚无公认的定义。

美国评价专家理查德·J.斯蒂金斯曾先后三次为表现性评价下定义,第三次(2005年)下的定义是这样的:“表现性评价就是让学生参与一些活动,要求他们实际表现出某种特定的表现性技能,或者创建出符合某种特定标准的成果或作品。简言之,就是我们在学生执行具体的操作时直接观察和评价他们的表现。”[3]我国最早系统研究表现性评价的周文叶,她曾为表现性评价下过这样一个定义:“在尽量合乎真实的情境中,运用评分规则对学生完成复杂任务的过程表现或/与结果作出判断。”[4]两个定义虽表述各异,但都或隐或显地揭示了如下关键点:(1)真实或近乎真实的情境;(2)学生完成某项任务;(3)执行具体的操作,展示实际的表现;(4)针对过程表现或结果;(5)直接观察和评价;(6)运用特定的标准评价。如果将评价对象“学生”更换为“校本研修”,删除“近乎真实”这一限制词,表现性评价的这些特征完全适用于校本研修。

这里,特别说说“直接观察和评价”,先看图1。

图1 校本研修质量评价的三条路径

图1中的A路径,就是校本研修传统的评价方式。被评价的学校,需要从校本研修的全部现场(现场),根据类似于表1的评价标准选取样本(取样),经由文字概括、分类整理等过程(转述),形成迎检时需要的“档案袋”。区域管理部门的评价者看材料(成文总结、分指标陈述、佐证材料等),听口头汇报(演讲、座谈),合议评定分数等级(评定),作出概括性反馈。

A路径的操作,从“现场”到“评定”,要经过取样、转述等环节,故而是一种间接的观察和评价的方式。不经取样、转述等环节,便是图1中的C路径,这是极端情况下的直接判断,评价者亲临各校校本研修的全部现场,依据评价标准作出判断。在现实中,这几乎是不可能的。

于是,为A路径、C路径的折中计,便是B路径。它无法像C路径那样作地地道道的“直接观察和评价”,但因其直接从“现场”中“取样”,未经文字概括的“转述”,能最大程度地减少信息损耗,因而依然带有“直接观察和评价”的特质,可视之为表现性评价。

学业领域的表现性评价,一般要求学习者完成一个任务/活动,或制作一个作品以证明其知识与技能等,即让学习者在真实情境(或模拟的真实任务情境)中去表现其所知所能。比如让学生录制一个朗读的音频,做一个生物标本,唱一首歌;再如让参与研修的教师设计一组符合特定要求的作业,录制一堂微课,撰写一个课例,等等。简单地说,就是以学习者“所做的”(直接证据)来评价“能/已做的”[5]。

校本研修领域的表现性评价,以“所做的”来直接评价“能/已做的”。它基于校本研修的真实情境,选取足以典型代表校本研修期望、能力、过程和结果的数据样本,对照特定的评价标准作出推理、判断与评价。尽管取样及取样后的加工,难免产生信息损耗,但相对于传统的评价方法,它可以较好地解决传统考评的问题,较为有效地评价各校校本研修的真实表现。余杭区的实践表明,它是当今比较理想的校本研修考评方法。

三、校本研修表现性评价标准的制订

表现性评价的核心要素包括表现性评价目标、表现性评价任务和评分工具。校本研修领域的表现性评价,需要遵循最基本的学理,也需要考虑校本研修的特殊情况。

(一)表现性评价目标的把握

不同于在学业领域实施表现性评价,在校本研修领域实施表现性评价,我们无须详细推敲具体的“表现性评价目标”,但评价标准的制订者应有开阔的视野,明白“为何评”(目标,评价构想),从而确定“借助什么来评”(表现性评价任务,或称为“评价项目”)。

为此,我们必须清楚,评价标准要引导各校开展怎样的校本研修,校本研修的理想状态是怎样的(要去哪里),校本研修的现状是怎样的(如今在哪里),如何到达理想中的校本研修状态(如何去那里)。为此,我们还必须明确:哪些理念应得到遵守?哪些内容应得到重视?哪些方式应该被选用?哪些成果应予以关注?

对校本研修表现性评价目标的把握,虽不求像学业领域评价那样精细,但如果不能从宏观把握“要去哪里”“如今在哪里”“如何去那里”,只是满足于“评价过了”,就很可能滑向通常的做法,而单凭行政手段的管理,很难引领校本研修走上专业化的道路。

(二)表现性评价任务的“取样”

学业领域采用表现性评价,需要设置表现性评价任务或作业,以收集学生是否达成学习目标的证据。校本研修的评价,表现性评价任务不在于“设置”,而在于“取样”。如前所述,区域管理部门的评价者不可能观察某校校本研修的全部活动。运用表现性评价最关键的就是如何科学可行地“取样”,使“证据”足以表征校本研修的真实过程和结果。

如何确定“取样”的范围?一般来说,可依靠校本研修系列制度。“去哪里”“如何去”或显或隐地体现于区域管理部门管理校本研修的系列制度中,评价任务可以从这些制度中导出。以余杭区的经验,最便于划定“取样”范围的,是区域校本研修的“运作流程”(如图2所示为杭州市余杭区采用的校本研修SCTT样式的运作流程)。

图2 校本研修SCTT样式的运作流程

然而,从“运作流程”导出的评价任务可能很多。此时,要根据“如无必要,勿增实体”的奥卡姆剃刀原则,剔除可有可无的、琐碎的、非关键的评价任务,并反复论证任务存删可能带来的影响。同时,还要加强评价标准的运用监控,及时作出调整。如余杭区设定的校本研修表现性评价任务包括三年规划、项目计划、云平台建设、研修案例等(如图2中加底纹的部分)。

(三)描述任务完成的关键特征

明确列入评价的表现性任务后,紧接着要回答“怎样的任务完成是好的”这一问题。俗话说,评价要抓住“牛鼻子”。这里的“牛鼻子”,不仅指精要的评价任务,也指足以揭示任务完成好不好的关键特征。

校本研修的特征描述,要遵循“行事标准”。就是说,在真实的校本研修情境中,“任务”要做得怎样就规定怎样,有关特征的行文尽可能减少多层“推论”。这里所说的“推论”,即如前文所说的,凭借一份领导小组的名单“推论”出“领导重视,职责明确”。这样的“推论”会使证据远离事实发生现场,从而造成证据力量的衰减。

比如三年规划的特征描述。三年规划是余杭区打造SCTT样式的第一项任务,旨在解决研修主题年年翻新、内容随意碎片等痼疾,培育校本研修制度重建、习惯沉淀的耐心。余杭区提供了三年规划的统一模板,包括现状分析、研修目标、行动路径、支持系统等四个板块,并对制作的过程提出了一系列要求。对三年规划的评价,余杭区强调制作的“过程”,对那些制作草率、应付了事的规划坚决说不,即规定“不符合可直接视为0分”,同时强调“结果”,用五条行文描述了“实质内容”的关键特征。

(四)任务分值(权重)的确定

为逃离百分制误区,余杭区采用小分值(5 分制)赋分,它源于美国教育评价专家格兰特·威金斯的建议:“提供有效适当的区分来保障足够公正的评价,但在量表上不宜使用太多的分值(通常不超过6分),以免破坏信度。”[6]实践证明,小分值评价易于评分操作,且有利于提高评价的效度、信度。

(五)评分工具的选择

用于表现性评价的工具有三种:核查表、表现清单和评分规则。核查表只用于检查对象是否具有某个特征,它无法用于复杂的校本研修的考评。评分规则要把评价的项目(任务)分解成各个要素,并提供每个要素不同层次表现的详细描述。这是校本研修评价的上佳选择。然而,这种评分规则的制作颇为耗费人力,可使用时却常被空置。故而,余杭区采用了表现清单(如表2所示),实践证明其有良好的信度。

经过四年的实践,余杭区建立了由三年规划、项目计划、云平台建设、研修案例、研修情况、资料与会务、研修成果、教师满意度等八项内容(也即八个维度)构成的评价标准。其中前四项属于定性评价(如表2所示),后四项属于定量评价(运用的是统计学知识)。相较前述《区域校本研修质量标准建设的探索》一文提出的评价维度(研修目标、研修内容、研修途径、研修方式、研修管理、研修保障、特色创新),这一评价维度是“可见”的,也更“可测”。

四、校本研修表现性评价的实施与成效

(一)以评价标准引导校本研修

评价标准并非要到考核时才使用。评价标准的使用,一般包括三个环节:一是公布并解读评价标准;二是充分利用评价标准引导各校的校本研修,不断监测并改进任务质量;三是依据评价标准对任务表现作出评价,并作出清晰且及时的反馈。下面以“云平台建设”为例进行阐述。

云平台是浙江省网络学习平台(http://yun.zjer.cn)“学校空间”的简称。之所以将云平台建设纳入校本研修评价的范围,是考虑这是“校本研修+互联网”的一种重要形式,具有资讯分享、过程监控等功能。推出云平台建设的评价标准后,余杭区专门组织培训,制作《管理教程》供平台管理者边学边做。此外,余杭区还通过《校本研修指南》明确无法在标准中体现的内容,如“功能明确”这一条要求:

“研修资讯”放置三年规划(置顶)、项目计划(置顶)、活动通知及项目总结等组织类材料;“主题研讨”围绕学年项目,放置活动设计、宣传报道、评比结果等过程类材料;“在线学习”提供线上课程与资源链接(置顶),提供拓展学习的素材,可以非原创,但不能有版权纠纷;“成果展示”放置校本研修中的原创成果(如研修感悟、教学设计等)。

(二)制订并使用评分细则

表现性评价属于定性评价,只凭表2中的“评分标准”还不足以统一评委行动,更无法根据现状需要作出调整。所以,制订评分细则很有必要。表3是“云平台建设”的“基本要求”部分的评分细则。

表3 “云平台建设”的评分细则(局部)

表3对“①建设了云平台;②材料及时更新”作了细则描述。在实施中,不同的评委可对照评分细则,随手记录“特殊状况”(无建设或其他状况),并由区域管理部门汇总、反馈给各校,以便于各校整改。这一评估设计,可以使评分的结果能得到良好的解释,体现出良好的公正性、透明性和及时性。

(三)SCTT样式及其评价标准得到好评

经过为期四年的SCTT样式实践,全区树立了以教师实践需求为本的研修理念,区域和学校层面均形成了校本研修的制度和操作流程,积累了一大批常规和特色校本研修的子样式,得到了专家与教师的高度评价。

2022年6月和2023年6月,余杭区两次组织由全区教师参与的匿名问卷调查。调查结果显示,全区教师对本校校本研修满意度的平均得分,连续两年都在4.75分以上(满分5分)。2023年6月,余杭区还组织了由全区165名校本研修管理者参与的匿名问卷调查,结果显示,校本研修管理者普遍认为SCTT样式及其评价标准“提供了很好的方向和范式,可推广,操作性强”,“促进了各校的常规工作迭代,各学校运行都很有自己的特色”。

猜你喜欢

余杭区表现性研修
余杭区为城市新中心建设展现排头兵担当
中小学骨干教师“双减”项目式研修模式探索
浅谈音乐课堂中的表现性教学提升策略
读迷作品
中国当代表现性水墨人物画的特色与发展
不谋全书者不足以谋一课——“整本书阅读导读课”研修心得
“研训导一体化”教师研修方式的实践与探索
浅谈中国画的表现性
表现性任务设计的3个关键点
能喝到几瓶可乐?