APP下载

高等教育评价“双刃剑”:何以兴利除弊

2021-03-24刘振天罗晶

大学教育科学 2021年1期
关键词:双刃剑教育评价高等教育

刘振天 罗晶

摘要: 教育评价是一把“双刃剑”,既有认知、说明、比较、激励、改进、提升等正向功用,也有导致工具化和功利化、加剧趋同化和分化等消极影响。科学用好教育评价这根指挥棒,对于促进教育事业健康发展、加快教育强国建设具有十分重要的意义。《中共中央、国务院关于深化新时代教育评价改革总体方案》对教育评价改革做了全面系统设计和战略安排,为今后的教育评价改革指明了方向。以此为基础,扎实推进高等教育评价改革,有效发挥其正向功能,克服负面作用,一是要破除“五唯”,复归高等教育评价本来目的;二是要强化分类评价,促进高校多样发展和特色发展;三是要稳中求进,探索新的评价方式;四是要强调多元主体评价,推进评价治理现代化。

关键词:高等教育;教育评价;“五唯”;“双刃剑”;分类评价;多元主体评价

中图分类号:G640 文獻标识码:A 文章编号:1672-0717(2021)01-0004-09

2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》),以新时代我国面临的新形势新任务新使命为出发点,以立德树人为主线,以破“五唯”为导向,以建立中国特色、世界水平的教育体系为目标,对教育评价改革做了全面系统设计和战略安排。《总体方案》一经发布,便引起高教战线以及社会各界广泛关注和热烈讨论。如何破除“五唯”,兴利除弊,科学用好教育评价这根指挥棒,促进教育事业积极健康发展,是一项值得深入研究的重大理论和实践课题。本文仅就切实推进高等教育评价改革,发挥评价正向功能,有效克服其负面作用谈几点认识。

一、高等教育评价与质量保障:一场方兴未艾的运动

高等教育评价是一项历史悠久的教育活动,几乎与高等教育同时出现,相伴而生。但它作为一项规范化、制度化和专门化的教育活动,却还是晚近的事,尤其是进入20世纪之后,它才得到迅速发展。这主要缘于以下几个方面:一是现代工商业活动中日益强化产品和服务质量,强化成本核算、质量控制和质量评价,并形成了较为系统成型的质量管理、质量控制和质量评价的理论与模式,由此迅速影响到社会其他生活领域,从而有力地促进了教育评价实践与探索;二是随着世界生产、经济和技术不断发展,相应地,高等教育规模不断扩大,日益成为一项庞大的事业和产业,也越来越需要源源不断的公共资源投入保障,而作为资源的供给方以及产品的需求方,政府、社会及公众开始关注高等教育质量,并不断加强对高等教育质量的评价与问责。尤其是20世纪70年代后期,一些发达国家出现了财政危机,教育投入逐渐下滑,进一步刺激了政府和社会基于高校资金使用效益和教育质量评价的拨款行为;三是国际、区域以及高等教育机构之间的教育质量竞争与合作,显著拓展了高等教育评价范围,提升了高等教育评价影响力。当代高等教育评价已不再是一项简单的活动或工作,而变成了长期性、稳定性与规范性的制度体系。有资料显示,目前世界上200多个国家和地区中,有180个以上建立了本国或本地区的高等教育评价制度及其质量保障体系,开展经常性周期性的质量评价活动[1]。美国国内有6大区域高等教育质量认证机构,负责对全国4 000余所高校的教育质量进行评价,同时还有近60家专业认证机构对全国高校专业进行质量认证,从20世纪初期至今已经开展了一个多世纪的高等教育质量评价活动;英国的大学基金会(UFC)和高等教育质量保障署(QAA)是两大著名的评价机构,对英国高校的科研、学科以及教学质量进行评价。法国、德国、澳大利亚所建立的高等教育质量保障和评价体系在世界上也有较大影响。在亚洲,日本、韩国、印度、马来西亚、菲律宾以及我国香港、台湾地区也建立了规范系统的高等教育质量评价制度,日本、印度等国每五年进行一次高等教育质量评价,菲律宾大学评价已实施了八个轮次。20世纪80年代开始,世界范围内掀起了高等教育质量保障的评价运动。受其影响,双边、多边性区域的以至国际的高等教育质量评价联合组织纷纷建立,开展国际的或区域的高等教育质量互认与评价,如旨在促进欧洲高等教育质量一体化的博洛尼亚进程(Bologna Process)。此外,像都柏林协议(Dublin Accord)、悉尼协议(Sydney Accord)、华盛顿协议(Washington Accord)以及国际高等教育质量保障机构联盟(INQAAHE)、亚太高等教育质量保障联盟(APQN)等,也都是公认的跨国性高等教育质量评价组织,在高等教育评价和质量保障中发挥着独特的作用。

就我国而言,高等教育评价晚于其他国家,基本上是从20世纪80年代开始起步的,但起点较高,发展较快。改革开放后,我们加强了对世界高等教育的认识和了解,有目的地介绍高等教育评价和质量保障,少数高校开设了教育评价学专题研究,在师范大学本科教育和综合大学研究生教育中增加了教育评价学课程及其学科方向,成立了教育评估学研究团体,出版了相应刊物。尤其是1985年,在我国教育发展史上具有划时代意义的重要文件《中共中央关于教育体制改革的决定》首次提出“政府要组织知识界和社会界对高等学校办学水平和教育质量进行评估”,拉开了教育评价理论和实践之大幕。随后,原国家教委在部分理工科院校开展了工科专业教学及课程评估,总计约有500个专业和课程点参与其中,积累了重要的经验。以此为基础,1990年,原国家教委出台了我国高等教育史上第一部高等教育评估法规,即《普通高等学校本科教育评估暂行管理办法》,对高等教育评估目的、意义、原则、内容、组织程序、方法、结论及其使用等作出了一系列规定。国家教育行政主管部门于1994年开始对改革开放后新建院校本科教学工作进行了合格评估,1996年开始对拟申请国家“211工程”重点建设高校的本科教学工作进行了优秀评估,1999年开始对其他类型的高校本科教学工作进行了随机性水平评估,总计有254所高校接受了此三类评估。2002年,教育部将三类评估统整为一种类型,即普通高等学校本科教学工作水平评估,并于2003年至2008年间,对全国589所高校本科教学工作进行了首轮评估。2011年,国家对高校本科教学水平评估方案进行了重新调整,实施新一轮的合格评估和审核评估,到2019年底,有240余所新建院校和650所老本科院校分别接受了合格评估和审核评估。

在对高校本科教学工作进行整体性评估的同时,我国还致力于本科专业认证和研究生与学位教育评估(一级学科评估)。专业认证同样始于20世纪80年代中期,起初从建筑类专业试点先行,90年代扩展到所有工程专业和医学专业,2018年开始师范类专业认证,期间先后约有3 000个专业接受了认证。2016年,中国工程专业认证协会成功加入华盛顿协议,成为其第18个会员单位,标志着中国工程专业教育质量获得了世界认可。我国研究生与学位评估始于2004年,至今已开展了4个轮次。本着自愿申请参加的原则,越来越多的高校参加到学科评估中来,使该项评估成为目前国内影响最大、声誉最高和结论最可靠的评估类型。此外,高等职业教育人才培养水平评估以及适应社会能力评估也同步进行。该评估由国家统一标准,由各省具体组织实施,先后进行了三个轮次评价,所有的高职高专院校均接受了评估。

无论是本科教学评估、专业认证,还是学科评估和职业教育评估,都是政府直接组织或委托具有官方背景的事业单位实施的。除此以外,还有一类评价,就是社会第三方机构,如新闻媒体、基金会、校友会、高校、研究院所等实施的,主要是基于公开数据的各类大学排名,包括综合排名和专项排名。目前,比较有影响的国际大学排名有美国新闻与世界报道(US-News)、泰晤士高等教育(THE)、汤森路透(QS)和上海软科(UR),各高等教育大国都有不少大学排名机构。我国现有高校排名机构近40家,每年都发布排名。

美国学者E·格威狄·博格教授说,21世纪是教育质量及其评价的世纪[2]。只要有高等教育的地方,就少不了评价、排名,想绕过评价和排名几乎是不可能的。由此可见,高等教育评价不仅仅是客观存在,而且种类、形式越来越多,活动也越发密集频繁,呈现出生机勃勃的势头。

二、高等教育评价“双刃剑”的正向价值及其功用

如前所述,教育评价之所以方兴未艾,之所以成为世界高等教育质量保障运动的重要形态,主要取决于高等教育评价的价值与功用。这种功用或价值,既可以诉诸主观的情感表达,也可以诉诸客观的事实;既可能是基于当下现实的,也可能是基于未来期待的。但无论如何,高等教育活动需要科学合理的评价,现代高等教育更是无法离开评价。其一,评价为高等教育活动提供了辨识、反思、调整和改进修正的机会。人类的教育是有目的的活动,从一开始便深深打上了意识的印记,接受人的意识支配。正如马克思所说,蜜蜂建筑蜂房的本领让人间许多建筑师感到惭愧,但是,再蹩脚的工程师也比蜜蜂高明的地方,在于他在建筑房子之前,劳动的成果便在他的头脑中以观念的形态存在着[3]。这是人的活动与动物本能之间的根本区别所在。杜威认为:“在所有深思熟虑的、有计划的人类行动中,無一不受对欲达目的之价值鉴定的左右。”[4]所以,评价是人的目的性活动的能动反映,它贯穿于活动过程始终,进而将人自身的教育活动时时拉回到它的原点,辨识其出发点,反思教育活动与目标原点或出发点的一致性。这不仅有益于考察活动过程是否符合或达成预期目的,还可及时发现活动与目标原点之间的差距及其偏离状况,使活动能够按照既定的目的顺利推进,并能在目标与行动之间相互检验和修正,增强活动的方向性、清晰性和有效性。可以说,正是由于有了教育评价,人们才能不断认识教育自身、不断交流学习、不断修正错误、不断增进经验,进而促使教育发展进步。其二,教育评价具有重要的激励价值。教育评价(Educational evaluation)是对教育目标及实现目标的教育活动进行分析和价值判断的过程。这种判断过程有两个方面,一方面是纵向回溯式的,着眼于与自身过去效果的比较,从而看活动发展进步的程度;另一方面是横向开放式的,着眼于与自身之外他人相应活动的比较,看活动过程效率、效果与效益。无论与自身比较,还是与他人比较,在比较中其结果无论是进步的或是退步的,都能够产生正向激发动力的功用,从而进一步增强活动的效能。教育之所以不断发展,就是源于通过自我评价与相互评价,产生竞争力。现代社会,教育评价往往是资源分配和获得的重要手段,也是科学地开展教育实践活动和提升教育质量的重要抓手。

上面讨论的是一般的理性认识。从实践看,高等教育评价之于高等教育活动的发展就更为直观而显著。这就是人们通常所说的,评价是高等教育发展的指挥棒、方向盘,是促进高等教育发展的强力杠杆,是检验高等教育活动效果的测量仪。其具体表现就是通过以评促建、以评促改、以评促管、以评促强,能起到促进高等教育发展不断走向卓越和提升品质的效用。以我国为例,它不仅鲜明地反映在高校本科教学评估工作中,也鲜明地反映在专业认证、学科评估和各类大学排名活动中。

我们先以本科教学评估为例加以说明。本科教学评估是我国政府实施和推动的旨在重视和加强本科教育与人才培养的评价工作。这项活动始于20世纪80年代,90年代开始扩大评估范围,进入新世纪,建立起了周期性的本科教学评估制度,所有高校的本科教学工作都需要接受政府组织的评估。本科教学评估从开始至今30余年时间,先后经历了评估试测试点、水平评估、审核评估三个轮次,近千所高校接受了评估。无论是合格评估、水平评估还是审核评估,都对促进本科教学发挥了重要作用。就近期实施的合格评估而言,它为高校提供了办好合格本科教育的目标方向以及基本遵循,即如人们普遍反映的,合格评估倡导的“三个基本”(教学条件基本达标、教学管理基本规范、教学质量基本保证)、“两个突出”(突出为地方经济社会服务、突出培养应用型专门人才)和“一个导向”(内部质量保障体系)及其具体评估指标体系,之于新建本科院校,无疑提供了教科书般的标准。由于合格评估是政府组织实施的,具有极大的权威性和动员力,因此,其引导和促进建设的作用也极为显著。有资料表明,参加合格评估的所有新建本科院校,均将自身定位为地方性应用型。80%以上的新建高校通过努力,在经费投入、生师比、办学条件、专业与课程、产教结合、实践教学等方面,基本达到了合格评估要求的标准,尤其是评建之年,各项指标明显高于平常水平。就审核评估来看,总数超过600所的高校评估实际状况显示,参评高校普遍实现了审核评估提倡的“一个坚持”(坚持以评促建、以评促改、以评促管)、“两个突出”(突出内涵发展、突出特色发展)、“三个强化”(强化办学合理定位、教学中心地位、质量保障体系建设)的目的,更加符合审核评估主张的“五个度”标准,办学定位更加注重对国家和社会需要的适应度,办学条件和教学管理更加强调保障度和有效度,教育教学过程追求达成度和社会满意度。

一般认为,作为整体性的高校教学评估,是高校教育教学质量建设的最先一公里,而作为专门性的专业认证工作,则被视为高校质量发展的最后一公里。专业认证深入到每一个具体的专业建设、课程建设、教材建设和师资队伍建设,深入到每一位教师的教学工作。专业认证倡导“学生中心、成果导向、持续改进”的现代理念,在具体教学评价中,进一步将学校办学定位细化为培养目标,进而再细化到专业目标、毕业要求、课程体系、教学策略、教学组织、教学方法和教学评价过程中,使其每一环节自上而下实现层层落实、压实和转换,自下而上实现层层支撑和目标达成;专业管理者和每一位教师都应该清晰自己的工作与专业教学目标各方面、各环节之间的关联程度、实现程度,做到会教、会讲、会导、会研,从而大大提升教学过程的针对性和有效性,有利于大面积提高教学质量。通过专业认证的高校,其教学的科学性合理性、教师及管理者教学理念的先进性系统性、教学实际效果等,都显著优于那些未接受过专业认证的高校。

学科评估主要以学位和研究生教育一级学科进行评价与排名,分为人才培养、师资水平、科学研究、知识转化和国际化办学等指标。评估结果分为A、B、C三个不同等级,第一等级内部再具体分为三个层级,如A+、A、A-等,依此类推,一共分为九个层级,实际上相当于以学术活动及其成果为标准,将不同高校分为不同的等级。换言之,学科评估是高校学术水平上下高低的排名榜。这对于高校学科建设、学术研究和人才培养,起到了巨大的推动作用。高校为了实现学科突破和水平提升,不断加大学科建设力度、人才引进力度、学科整合力度和质量管理力度,加大了科研奖励力度,整体上有力地促进了高校学科建设和水平提升。

大学排行榜是典型的社会评价,以公开发布的公共数据为基础,通过一定的指标体系结构赋值,将不同高校的整体办学或者学科专业单项状况,以直观的得分形态呈现出来。大学排行榜在社会上影响很大,往往成为学生及其家长升学择校、社会选人用人的重要依据和参照。一些高校十分重视大学排行榜的作用,通过分析其内容结构、侧重点、发展趋势以及社会公众态度等,甚至以排行榜指标来调整学校的办学方向和修正办学策略,以争取更好的位置,提升学校的名望和声誉。在我国,国际上四个著名排名榜对一流大学的影响巨大,尤其是排行榜中师资力量、科研成果、知识转化、课题奖项等,往往成为大学竞相追逐的风向标,在某种程度上发挥了激励大学不断力争上游的重要作用。

学术界一直认可和盛行的论文、课题、影响因子、成果获奖、人才称号等所谓“四唯”或者“五唯”评价现象,实际上是高校教师职务晋升、资源分配、荣誉奖励等的重要依据,深受教师重视。实事求是地说,这些评价指标和标准,在很大程度上激发和促进着高校教师知识生产与再生产的热情和干劲,中国科技事业因此而突飞猛进,迎来了高速发展的黄金时期。统计显示,2016年,我國发表的学术论文42.6万篇,首次超过美国(40.9万),跃居全球第一;发表的SCI论文数自2008年以来连续12年排名世界第二位[5]。这些成绩的取得,不能不归功于“四唯”或“五唯”评价因素,正是它们极大地提高了学术界知识生产的数量和效率。

三、高等教育评价“双刃剑”的负向作用及其成因

任何事物都有两面性,教育评价也像一把锋利的“双刃剑”,在表现并发挥其正向价值和功用的同时,呈现出负面作用。人们之所以提出改进评价工作、破除“五唯”等一系列要求,原因就在于评价工具、评价制度和评价工作本身出现了不合理的导向,给教育实践带来了消极影响。其主要表现在以下几个方面:

一是教育评价会进一步强化外部行政权力,使高校办学、教育教学受到外部力量左右,进而侵蚀和降低高校办学自主权以及学术自由。如前所述,教育评价对教育活动具有鉴定、证明、引导、激励和改进的作用,即通常所说的以评促建、以评促改、以评促管、以评促强。教育评价所以如此,足以说明评价是一种权力。教育评价的主体,来自不同的利益相关方,既可以是政府,也可以是社会中介机构,还可以是社会用人部门、公众、媒体、学生以及家长,当然也包括高校自身。从实际情况看,中外高等教育评价主要是由政府或者经政府许可的、代表政府和社会对高等教育行使评价与问责的第三方机构组织实施的,因此体现了政府和社会的意志。按照美国著名教育家、加州大学总校校长克拉克·科尔的观点,政府、高校与社会是一种呈三角形关系域的不同力量,形成了不同的治理结构。强化任何一方力量及其关系,都可能会导致另两方力量与关系的削弱。不过,不同的国家,三角形的结构及其力量有所不同。在西方,长期以来,受新自由主义思想影响,高等教育奉行着学术自由、大学自治和教授治校,政府对高等学校的影响力较为薄弱,但20世纪80年代金融危机之后,政府对高等教育开始加以干预,行政权力有所抬头。20世纪80年代开始的世界范围内的高等教育质量保障运动,在一定意义上可以看作是政府及社会综合发力的产物。政府借助于教育评价和质量保障,将外部标准自然而巧妙地转化为大学的办学质量标准和行动规范,评价对高校产生了思想和行为规制效用。当然,这也引起了高教界和知识界的警惕和忧虑,不少学者明确提出评价是新干预主义、行政主义和管理主义,反对评价对学术自由和大学自治的限制。

我国高等教育长期以来实行的是政府集中统一领导和管理的制度。这种制度有其客观历史必然性,也确实有其优势,但同时也有不少缺点和问题,主要是政府管得过多、过细、过死,高校缺少办学自主权,缺乏主动面向社会办学的意识和能力,高等教育生机活力不足,特色不显,办学模式趋同,质量和效益不高。因此,改革开放之后,高等教育体制改革中重点解决的就是理顺政府与高校的关系,政府简政放权,扩大高校办学自主权,政府职能由过去计划经济时代的过程管理转变为宏观管理和服务。这种宏观管理的手段,就是从以往过分依靠行政许可与审批的方式手段,过渡到主要依靠法律的、信息的、经济的、行政的、评价的等综合方法。然而,政府在转变职能过程中,我们看到,前置性的许可与审批确实明显减少,但对高校办学过程与结果的评价、评估、审计等却不断加强,以致于来自政府的评价、评估、评审、评比越来越多,重复评价评估现象较为严重,不同的评价、评估相互之间存在矛盾,影响和干扰高校正常办学和教育教学秩序,高校受累于评价评估。如此,教育评价评估非但未能减轻高校负担,反而进一步增强了政府的行政权力,弱化了高校的办学自主权。换言之,计划经济时代政府行政权力在于起始的审批和许可环节,但当前政府的行政权力却来自过程与结果评价,简化后的审批和许可权力变相转移到过程和结果评价之中,政府热衷于设置评价标准并运用评价手段指导、干预和管控高校,从而形成了评价规制与评价霸权,教育评价进而走到高等教育管理体制改革方向的反面。教育评价成为管理主义的代名词,成了高校发展新的“紧箍咒”。

二是教育评价导致高等教育活动目标外在化、片面化和功利化。教育评价本身是行为主义的产物,也就是说,任何事物在评价那里或者对于评价而言,均需要将其转化为可观察、可测量、可操作的对象,将内在转化为外在、内隐转化为公开、定性转化为定量、整体分化为部分,最后用一种相对确定的数据、数字或者可描述的语句,还原出整体的状况。无论是学科评估、教学评估、专业认证中各级指标体系,还是林林总总的大学综合排名与专项排名标准体系,无不如此。由于事物原本是不可分割的整体,但为了评价、为了说明、为了验证,必须把事物进行逐层分析,在思想和行为上分解为不同的部分与方面,尤其是分解为那些可以用来观察和测量的部分,这样就必然会丢失某些部分,特别是失去那些无法用数量反映的内在成分。而事实上,这部分对事物本质的认识和揭示更为重要。如此一来,便不能从根本上完整准确地说明和反映事物的全貌,就必然导致评价失真。评价结果所还原出来的整体,已经不再是事物原本的整体,它不是远离事物本体,便是背离事物的本体。建立在数据、定量、行为等可测量指标基础上的教育评价,一定程度上是对事物的一种片面反映和说明。这一点,可以从近几轮次政府开展的教学评估、学科评估以及大学学术排名、教师职称评审等方面得到集中体现。例如,高校学科本来是人才培养、科学研究、学术交流、成果转化以及知识生产与再生产的主体,但长期以来,学科评估对人才培养重视不够,学科评估中虽然也有人才培养质量指标,但仅仅是少数几个标志性数字,如高校生师比、国家级教学成果奖数量、国家级精品课程数量、专业教学实验室数量等。很显然,完整丰富复杂的、富有价值与情感因素的、反映人与人关系本质的教学活动,最后只是简化为这几个数字,这样的教学还有什么生命力、想像力和丰富力可言?这些数字表达出来的教学,能够被认同和还原为实际教学质量吗?同样,教师的学术水平仅仅用文章发表、科研课题、到账经费、文章影响因子来评价,会造成许多问题甚至出现笑柄。最近,国际一知名大学排行榜将山东某两所省属高校数学学科分别排列为亚洲第一和第五,远远高于被公认为一流水平的北京大学等高校,原因就出自简单化的只计文章数量和高被引率,不计论文质量。而论文引用是可以人为操作的,这是内外夹攻的片面化和表面化。

与片面化表面化相应的,教育评价还容易造成功利化。由于评价总是与质量、声誉、资源分配、能力或水平等联系在一起,所以评价往往被行政部门、高校、教师甚至社会异常重视并利用。人们追求好的评价结果,希望通过评价提高声誉、获得资源和改变命运,故而在评价评估评审中,不可避免地出现使评价有利于自身利益的动机和行为,甚至出现弄虚作假、夸大其辞、不良公关等现象。这不仅与评价初衷相违背,更与教育活动价值与本质目的相背离。教育评价在一定程度上助长和强化了办学过程以及学术活动的功利主义倾向,无论是本科教学评估、专业认证、学科评估,还是大学排名中,这一倾向都有相当程度的存在。这些评价、评估和排名,都设置很多标准与指标,而标准和指标却是高度概括甚至是划一雷同的。但高校为了取得好的评价结果,往往机械照抄、迎合标准和指标要求,按图索骥、对号入座甚至削足适履,唯恐遗漏、偏失对自身不利,在划一的教育评价标准面前,高校刻意将自身实际、差异与个性掩盖或掩藏起来,这是功利性最明显的表现,也是最不良的表现。同样,学术评价中过分强调论文数量、影响因子、获奖以及科研项目,使高校教师和科研人员围绕数量指标运转,忘记和扭曲了学术研究的本质与价值。在那里,论文发表、文章数量、影响因子、科研项目和经费成了目的,严重影响和制约了学术活动的纯度和深度,为发表而发表,以致学术不端、投机取巧、急功近利和浮躁之风较为严重,且不是个别现象。这种异化,正如荷裔学者格特·比斯塔所言,評价已经从工具僭越成为教育的核心、评价结果成为决定教育政策的主要参照、教育也从促进生命成长的活动变成了僵化的管理行为,如果任其发展,将会导致教育价值和目的的失语[6]。

三是教育评价会使教育活动加剧分化,造成事实上的教育不平等。从宏观结构上来看,高等教育有类型、阶段之分,也有区域之别;从外部因素来看,经济收入、政治环境、文化风俗、历史传统各异,影响高等教育发展水平与习性;从内部因素来看,学生生源素质、个性特长以及学校校风校纪、特色优势不尽相同,在诸多因素的形塑之下,教育呈现出多样化状态。在这种情景之下,即使评价指标再精细,也无法顾及其方方面面。然而,问题恰恰就产生在这里:为了评价客观、准确和高效,评价者往往采用相同的标准来评价不同高校、院系以至教师和学生。这样做,不仅会导致这些不同主体与活动被动符合与适应外在客观标准,沿着相同目标和方向运行,造成思路与模式趋同,而且更严重的是,在同一路径之下将不同活动主体与活动效果区分为不同等级,并以此标识出不同的地位和资源获得能力,会人为地造成新的不公平。在绩效主义之下,其后果就是“强者愈强、弱者愈弱”,加剧了高校之间和个体之间在政治资本、经济资本、社会资本和文化资本占有上的失衡,马太效应日益明显,教育不公平问题非但未能消除,反而会导致其不断扩大与加深趋势。这与新时代人民群众对“更加公平更有质量”的教育之需求相背。

四、正本清源:高等教育评价兴利除弊的路径

高等教育评价的发展历程,实际上是不断总结经验、发现问题,增进和累积正向价值,减少和克服负面效应的过程。当负面效应发展到一定程度,特别是导致违背教育规律,远离教育价值,无助于教育目标使命时,就必须对其进行改革。这正是中共中央、国务院出台《总体方案》的重要原因。

(一)破除“五唯”,复归高等教育评价本来目的

《总体方案》开宗明义地指出,要改革教育评价这根指挥棒,系统构建体现党的教育方针、社会主义办学方向,符合教育规律、评价规律和人才成长规律的科学的教育评价体系,坚决破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾。破“五唯”不是不要这些标准和指标,它们是评价教育质量、学术水平和能力的重要因素与条件,然而,如果将其推向极端化,那么教育评价标准便只有“一维”了,必将导致评价的外在化和功利化,形成不良的教育观、人才观和评价观。教育评价要破除“五唯”,必须坚持科学发展、内涵发展、特色发展和创新发展道路。要回归教育本质,唤起教育教学和学术生活内在的生命力,恢复人们对学习知识和发现真理本身的虔诚,防止形式主义和功利主义至上。

“五唯”之所以成为顽症,并非一时兴起的现象,而是长期积累和发展的结果,其中既有深刻的历史、文化和心理等原因,也有直接的社会现实原因。一千多年的科举制、知识分子读书作官的心态是“五唯”问题产生的重要因素;新中国成立以来,尤其是改革开放以来实施的经济、科技和文化全面赶超型发展战略,也是教育评价和学术评价重结果轻过程、重外在轻内在、重短期轻长远的直接因素,加剧了教育和学术评价的短期化功利化。经过几十年建设和发展,我国已全面进入新时代,经济总量跃居世界第二位,科技发展中许多领域已经摆脱了对发达国家严重依附的局面,个别领域取得了相对优势,整体上从以往的跟跑向并跑甚至领跑转变。在这种情况下,我们不仅有了更加足够的条件,也应该有足够的自信和从容,真正去发展科学、发展教育,回归教育和学术本心、回归知识本位。在努力实现教育、学术、教学、办学回归初心的同时,我们也要清醒地认识到,单靠功利型追赶式科技和教育不是长久之计,根本路径还是要靠基础领域的重要创新。高等教育评价破“五唯”,就是坚守学术和教育本质、体现教育规律的一项功在当代、利在千秋的大业。

(二)强化分类评价,促进高校多样发展和特色发展

“五唯”之所以是不良好的评价观和指挥棒,其实质就在于将评价的多维变成了一维,即无视被评价对象的差异性而强行用统一的分数、升学率或者论文数量来衡量水平或质量,抹煞了事物的多样性本质。

我国高等学校总数3 000余所,可谓千差万别。不同的高校既有不同层次水平、不同科类和培养目标、不同服务面向,又有不同历史传统、办学条件、社会期待等等,而同一高校内部各学院、学科和专业之间也有较大差异,客观上来说不能用同一尺度和标准进行评价。但长期以来,由于评价中盛行的管理主义、技术和效率至上,高等教育评价中存在简单化、标准统一化等现象,以致出现许多问题。如前面指出的高校工作中存在重科研轻教学问题,科研工作中重数量轻质量、重外在形式等级轻内在实质贡献问题,等等,高校围绕单一标准办学,模式趋同缺乏特色。因此,必须对评价进行系统改革和系统设计。要根据高校不同发展目标定位、服务面向、发展阶段、科类层次等,分别制定不同的评价标准,引导高校多样化发展、特色化办学。《总体方案》提出,要改进高等学校评价,推进高校分类评价,引导不同类型高校科学定位,办出特色和水平。在本科教学评估中,要突出思想政治教育、教授为本科生上课、生师比、特色优势专业、用人满意度等指标;在学科评估中要强化人才培养中心地位,淡化论文数、引用率、获奖数等量化指标,突出学科特色、质量和贡献。新的本科教育教学审核评估方案,已经分别按照一流大学、地方本科高校和新建本科院校进行了分类设计。其中,针对一流大学,侧重评价其内部质量保障制度与机制运行状况,使用质量保障体系评价方案;地方本科高校则使用教育教学工作方案,但方案根据不同高校学术性与应用性,进一步提供了可选择的项目,高校可根据自身实际情况,进行相应选择。新的学科评估方案,去除了论文数量、刊物级别、人才帽子等,突出了代表作及其评价,强化学术同行评价,重在学术水平和贡献。这些都是重要的进步,代表了改革的方向。可以预见,新的分类评价对高校科学办学和特色办学将产生积极影响和推动作用。

(三)坚持稳中求进,探索新的评价方式

《总体方案》指出,教育评价要坚持科学有效的原则,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高评价的科学性、专业性和客观性。实际上,它提出了新的更加科学有效的评价方式。

一是要改进结果评价。高等教育是有目的的活动,追求好的教育教学效果,包括教学、科研和服务效果,是必然的,也是必需的。但是,教育教学活动的结果是多方面的而不是单一的,不能将结果片面理解为学业分数、论文数、获奖数、经费数、项目数等,培养德智体美劳全面发展的社会主义建设者和接班人,是教育的最终目的,也是最终结果。因此,一定要从全面的结果而不是片面单一的结果来理解教育结果评价。要坚持教育结果评价的全面性,还要坚持結果评价的科学性。如何评价学生品德?不能简单地局限于一两次好人好事,或者课程考试成绩,而应该对学生的理想信念、思想认识、道德情操、意志品质和行为习惯等进行全面考核,以此作出全面的评价。

二是要强化过程评价。对他人以及对自身的认识与评价,不可能一时一地和一次性完成。结果的评价是在长期反复的认识和交往过程中获得的,越是注重过程评价,结果评价就越是全面客观。对大学教师的评价,也不能仅仅看其文章数量,而要看他们发展的一贯过程及表现。对一项学术成果水平的认定,不能只看刊物级别或者获奖级别,还要看成果在学界的反应以及持续影响力。对学生评价,不能仅凭一两次考试分数或者获奖情况,要注重考察学生平时学习和生活中的各方面表现。

三是要探索增值评价。所谓增值评价,是一种相对评价,即相对于学校自身、教师和学生自身发展所开展的评价。增值评价不是组织之间或者个体之间的横向比较,而是注重自我纵向发展与努力进步的程度,因此这是一种发展性的、过程性的、用自己的尺子衡量自己的评价。学术和教育的目的,不只是简单比较谁高谁低,不只是培养少数尖子学生或者精英学者,还在于促进每一学生和学者的发展与进步,唤起每一个体的生命价值和生命活力。这是一种符合人的发展、人性发展的和谐发展观与学术评价观。长期以来,我们的教育和学术存在相当大的误区,就是过分重视横向比较,过分强化竞争,这不仅导致高校师生负担过重,更造成了畸形的人格、畸形的教育和畸形的学术。除了少数所谓成功者,绝大多数人成为学习和学术道路上的“失败者”,无助于人的成长,无助于学术发展。因此,必须强化增值评价观,使每一群体或个体都能体验到进步的程度和进步的快乐。

四是要完善综合评价。马克思指出,人的本质不是单个人的抽象物,在现实性上,人是一切社会关系的总和。所谓总和,即人的活动总是涉及物质的、精神的,生产的、交往的、文化的、社会的、历史的多方面内容,人的身心发展也必然受到其所在的经济社会、历史文化、风土人情等各方面因素的影响与制约。因而,对人的评价,包括对学生发展过程及其结果也需要从多方面进行综合分析和评价,只有这样,才能获得对人对事的全面而完整的认识。过去评价学生或教师,总是单一标准,奉行学习成绩与分数至上,或者唯论文唯文凭,三好、五好,归根到底是一好,即学习成绩好或科研成绩好。这样的评价既不公平又不合理,割裂了人的发展中政治与业务、知识与能力、品行与才智、做人与做事之间的统一关系,导致教育过程中出现许多问题。综合评价,不仅是评价德智体美劳等多方面内容表现,也在于运用多种方法和手段。考试、应试、分数只是其中一个方面,日常生活考察、行为记录、同行评价、自我评价等都是重要的评价形式,特别是借助于互联网和信息技术,建立组织与个人发展大数据,对个人品行、知识、能力、责任心和创新精神等进行经常性和连续性监测,更有利于作出全面客观的评价。

(四)强调多主体评价,推进评价治理现代化

改变评价标准单一、主体单一、方式单一情况,是教育评价改革的目标和方向。之所以强调和推进评价主体多样化,原因就在于以往的评价一直由政府直接组织,政府作为高等学校的举办者和管理者,直接组织评价工作,管办评不分,不能很好地体现评价的客观性、公正性和专业性,不能有效反映不同利益方的利益需要,尤其是政府的权威性以及政策引导,往往导致评价目的性和功利性过强,评价手段与目的错位。因此,需要改变政府单一评价和治理格局,构建多方评价主体共同参与、共同评价的新体系。一方面要转变政府职能,推进管办评分离和放管服结合,政府在制定评价政策和方针过程中,要听取并反映不同利益方的意见和要求,增强高等教育发展和改革的针对性与适应性,积极充分相信、依靠和扶持发展社会中介组织机构,加强对中介组织机构的指导和规范,支持其独立自主地开展高等教育评价工作,合理使用第三方评价结果。另一方面,社会中介组织机构要加强规范化和专业化建设,提升评价质量和水平,为政府、高校和社会提供高质量服务,促进高等教育科学发展和内涵发展。

多主体评价不是形式,而是建设现代高等教育治理体系的需要。除发展社会中介组织之外,还要依靠和充分发挥学术共同体、高校学术委员会、教授会在学术评价中的作用,大力推进同行评议制度建设,改变行政评价超越学术评价的状况,制定学术同行评议规程,阐明其性质、地位、结构、功能以及活动方式,保证评价结果公平和程序正義,提升学术评价、同行评议的声誉与质量。

参考文献

[1] 刘振天.系统·刚性·常态:高等教育内部质量保障体系建设三个关键词[J].中国高教研究,2016(09):12.

[2] [美]E·格威狄·博格,等.高等教育中的质量与问责[M].毛亚庆,刘冷馨,译.北京:北京师范大学出版社,2008:1.

[3] 中共中央马克思、恩格斯、列宁、斯大林著作编译局.马克思恩格斯全集(第23卷)[M].北京:人民出版社,1972:202.

[4] [美]约翰·杜威.评价理论[M].冯平,余泽娜,等译.上海:上海译文出版社,2007:4.

[5] 佚名.2019年1月1日至2019年12月31日各国家和地区发表的SCI论文数量[EB/OL]. (2019-12-31)[2020-11- 06].https://tieba.baidu.com/p/6421616005.

[6] [荷]格特·比斯塔.测量时代的好教育[M].张立平,韩亚菲,译.北京:北京师范大学出版集团,2019:4.

The Double-edged Sword Effects of Higher Education Evaluation: How to Seek Advantages and Avoid Disadvantages

LIU Zhen-tian LUO Jing

Abstract: Educational evaluation is like a "double-edged sword", which not only has positive functions such as cognition, explanation, comparison, motivation, improvement and promotion, but also has negative effects such as instrumentalization, utilitarianization, assimilation and differentiation. Scientific use of the baton of education evaluation is of great significance for the development of education and the construction of a strong educational country. The Overall Plan for Deepening Educational Evaluation Reform in the New Era makes a comprehensive and systematic design and strategic arrangement for the reform of educational evaluation, and points out the direction for future reform of educational evaluation. Based on the plan, four aspects are needed to promote the reform of higher education evaluation so as to maximize its positive functions and overcome its negative effects: firstly, we must resolve the deep-rooted problem of“five-only”and return to the original purpose of higher educational evaluation; secondly, we should strengthen classified evaluation to promote diversity and characteristics of colleges and universities; thirdly, new evaluation methods are needed to seek improvement while maintaining stability; fourthly, multiple-subjects evaluation is key to the modernization of educational evaluation and governance.

Key words: higher education; education evaluation; "five-only"; "double-edged sword"; classified evaluation; multiple-subjects evaluation

(责任编辑 李震声)

猜你喜欢

双刃剑教育评价高等教育
关注“人的发展”:“核心素养”观下学校教育的召唤
基于幼儿成长的有效教育评价研究
关于应用型计算机专业培养方案的研究
基于Flash+XML技术的护理技能虚拟教学平台设计与实现
中国高等教育供给侧改革研究:起源、核心、内涵、路径
高等教育教学中的重与轻分析
初探教育评价的改革
直了集
知识是把双刃剑