从动态系统理论视角看语言测试的反拨效应

2016-04-10王初明亓鲁霞

山东外语教学 2016年4期

关键词：子系统效应考试

王初明，亓鲁霞

(广东外语外贸大学外国语言学及应用语言学研究中心，广东广州 510420)

从动态系统理论视角看语言测试的反拨效应

王初明，亓鲁霞

(广东外语外贸大学外国语言学及应用语言学研究中心，广东广州 510420)

在当今人文社科研究领域，动态系统理论用得越来越广泛，却未见用于语言测试反拨效应研究。本文在简介动态系统理论核心观点的基础上，分析和论证这一理论用于反拨效应研究的合理性和必要性。分析表明，反拨效应产生的过程具有动态系统的主要特征，借鉴动态系统理论和方法来研究反拨效应，将改变传统研究思维，能更全面阐释反拨效应产生的机理，也能为深化反拨效应研究打开新的空间，还能为解决应试教育问题提供新的思路。

动态系统理论；反拨效应；非线性因果关系；考试风险

1.0 引言

在当今语言测评界，考试对教学的影响(即反拨效应)备受关注，被视为研发考试的首要考量(Bachman & Palmer,2010)。对于任何大规模高风险考试或测评系统，因其牵涉面广，影响力大，反拨效应研究都是不可或缺的。按其性质划分，反拨效应可分为两类：一类是促进或引导教学的正面反拨效应，另一类是阻碍或误导教学的负面反拨效应。如何弘扬前者抑制后者，一直是考试设计者和研究者关注的重大问题。在过去20多年里，学者们针对反拨效应开展了大量研究，一方面加深了我们对考教关系的认识，另一方面也暴露出研究存在的一些问题。例如，研究虽然揭示了反拨效应现象的复杂性，却一直未能明确考试与各利益攸关群体之间的关系。研究者们倾向于简化问题，试图建立考试与教学两者之间的直接因果关系，而将其它因素视为干扰，另行描述。这样的研究结果往往难以充分解释反拨效应的复杂表现，面对包括应试在内的负面反拨效应，未能提供有效的应对之策。为此，本文尝试借鉴动态系统理论(Dynamic Systems Theory,简称DST)的一些基本观点，反思和剖析反拨效应现象和主要研究结果，进一步探究反拨效应产生的机理，为深化反拨效应研究提供新的研究方向和动力。

2.0 DST简介

上世纪中期以来，科学研究领域经历了一次思维范式转变。经典科学研究范式通常把事物进行分解，针对剥离出来的个体开展研究；而新的范式则着眼于事物的整体，将其视为复杂的动态系统，探究系统各要素之间及其与环境的交互动态关系，从而认识系统的特征与规律，以求达到管理、改造、调整、优化系统的目的。这种新思维范式集中反映在一组理论之中(如复杂科学、混沌理论、全息论等)，其中就包括本文关注的动态系统理论(DST)。DST的应用最初出现在物理、数学、气象等科学领域，现已推广到社会学、教育学、心理学、第二语言学习研究等人文学科。而将此理论应用于语言测试反拨效应的研究，迄今尚未见有报道，却是值得探讨的课题。为了此应用，我们先简单介绍DST的一些基本理念。①

DST的一个主要观点是，世间万物由大大小小的系统构成，系统具有复杂性、开放性和动态性特征。在DST的视角下，系统是一个复杂体，也被称为复杂系统，系统内部呈网状结构，大系统中嵌套着子系统，子系统又包含下一层级的子系统，一个系统相对上一层是子系统，对应下一层是母系统。系统的各个组成部分(要素和子系统)交互连接，相互依存。以语言为例，任何一种语言均可视为一个系统，其下包含语音、词汇、句法等相互关联的子系统。系统总是在发展变化。随着时间的推移，系统内部各要素与各子系统之间相互作用，并且与所处环境(即外部因素)发生交互和置换资源，获得发展动力，体现了系统的开放性和动态性特征。de Bot & Larsen-Freeman(2011)用海滩上堆砌的沙堡来比喻这些特征。沙堡完成之初，适当的沙粒湿度和黏着度使其暂时保持形状。这是系统的平衡状态，外观上看似毫无变化，实则不然，在沙堡内部，沙粒的干湿与黏着度始终在变化着。在沙堡外部，裹挟着细粒的海风冲击着沙堡，而路人的脚步也会振动沙堡的基础。在内外合力的作用下，沙堡系统的变化最终跨越临界点，一部分跟着另一部分坍塌，然后沙粒停止流动，系统呈现另一形状，进入新的暂时平衡状态。

非线性因果关系是动态系统的又一重要特征。在系统的演变过程中，促变因素与结果之间的关系通常是非线性的(non-linear)，输入与输出往往不成正比，大输入或许导致小产出，而小输入也可能促成大产出(Dörnyei,2014)。在特定的时间和条件下，一个小触动有可能给系统带来巨大震动，使之陷入无序状态甚至崩溃，如一枚滚落的卵石可能导致一场雪崩。这种现象被称为蝴蝶效应。蝴蝶效应的存在表明，复杂系统各要素之间或与环境之间的交互作用具有放大效应(Larsen-Freeman,1997)，还具有不确定性(non-deterministic)和不可预测性(non-predictable)等特征，它们之间通常呈现双向甚至多向的交互关联，而不是单向的因果关系。

复杂系统的特征告诉我们，从DST角度开展科学研究，需要遵循下面的思路。首先，研究要从事物的整体着眼，探究系统各部分或各变量之间的互动关系，以及由此产生的格局(pattern)。研究重点可以放在系统的某个层面，同时兼顾其它因素，因为系统结构是层层嵌套的(nested levels)。“认识部分和整体构成了一种环路：通过整体认识部分，通过部分认识整体”(周志平，2005：2)。其次，研究要描述系统的相互适应性(co-adaptation)，即描述系统各部分之间的双向甚至多向联系，因为系统各部分以及系统与环境交互关联，互为因果。例如，本族语者与非本族语者交流时，双方都会调整语速、语调、词汇、语法等以促进交流，外语学习者的中介语便是在这样的交流中演变发展的。正如Larsen-Freeman & Cameron(2008)、de Bot et al.(2007)所指出的那样，DST的研究思路有别于传统研究理念，经典研究的任务是描述、解释和预测，而DST则通过描述以了解系统的结构、发展轨迹以及可能浮现的新状态和新格局，并非预测具体结果；基于DST的研究结果仅用于解释在相同时空条件下所发生的同类现象，不做出普适的概论(universal generalization)。这样的研究理念给我们探究反拨效应带来什么启示呢？这是下面要讨论的问题。

3.0 反拨效应：考试与教学和社会互动的格局

教育界通常认为，在考与教之间，起主导作用的是考试，考试搞好了，对教学自然产生正面反拨效应。在美国，普遍以考试评估教学，问责学校与教师，以求教学得到改进，此做法始于上世纪70年代并延续至今(Amrein & Berliner,2002；Frederiksen & Collins，1989;Popham et al.,1985;Strauss,2013)。我国的高考英语和大学英语四、六级考试也多少承载着促进教学改革的重任(桂诗春等,1988; Li,1990;杨惠中、Weir,1988)。从DST 的角度看，反拨效应不由考试单独引发，而由社会、各教育部门和教学环节等多重子系统互动产生，考试仅为反拨效应的源头。因此，研究反拨效应，需将考试置于更大的动态系统中去考察，探究各相关子系统的作用及其联系，不宜狭隘地强调考试的主导作用，接受教学的所谓“被动性”，而忽略促成反拨效应的非考试因素。

借鉴DST来研究反拨效应，我们不妨从教学和考试这两个子系统入手，探讨它们与其他相关子系统的联系。教学是教育系统中的一个子系统，有其自身独立性与完整性。此系统牵涉到家长及行政管理人员(校长、教务处长、教辅人员等)，还包括其他要素，如教室、教学设备、教材、教学时间等，但主体是教师和学生。从时间角度看，教学可分为课堂教学和课外教学，教师布置的课外作业是课堂教学的延伸，而学生周日和假期参加培训班是学校教育的补充。所有相关人员和要素形成网络结构，通达关联，并与社会中的其它系统发生交互，共同促进学生的成长变化。

考试种类繁多，每一种可视为一个子系统。不同的考试具有不同的功能，发挥不同的作用，且与社会因素交互，动态演变而呈现不同的格局。以校本考试为例，此类考试属于教学系统中的子系统，用于满足教学需要。教师要了解教学效果，学生和家长想了解学习情况，均可借助考试所提供的信息。校本考试多由教师自行设计并实施，结构较为简单，功能相对单一。相比之下，校外的大规模考试就复杂许多，属于社会巨系统中的子系统，如我国的英语等级证书考试(PETS)和高考。这类考试的结构往往比较复杂，与社会大环境因素及其他子系统互动活跃，累积起多种功能。以我国高考为例，该系统包括语文、数学、英语等各个学科的考试，每个考试又自成子系统，拥有不同的版本，如自命题省市的版本和全国统考版本，后者还包括新课标省市的版本、少数民族地区的版本等。具体到一个科目的考试，子系统要素包括考试内容、结构、题型、分值等。高考除了结构复杂之外，功能也呈多样化。高考成绩不仅决定考生能否上大学，上什么样的大学，还被学校用来评价教师，被上级教育部门和社会用来评价学校。

考试的多功能意味着，考试能将教学、教育、社会等子系统关联起来，成为教育系统与社会各子系统之间的一根纽带。早在上世纪，美国各州的教育部门就采用大规模标准化考试来评价教师、课程和学校，并决定教育经费的配置(Linn，2000；Nolen et al.，1992)，于是，考试使得学校与政府财务部门发生联系。我国的大学英语四、六级考试成绩被社会上一些单位用于招工，使得学校与社会关联起来。世界经济合作与发展组织(OECD)实施学生能力国际评价项目(PISA)，通过考试和问卷形式评估各国教育水平，并将结果向全球公布，使得世界上数十个国家的教育子系统发生关联。由此可见，考试是维系人类社会网络关系的一环，其存在由社会需求决定，必要的考试不能随意取消。值得注意的是，这样的考试一旦取消，其它考试也会发展起来，填补空缺。例如，为了减负，教育部下令取消了小学毕业统一考试，斩断了小学与初中原有的一条纽带。于是，其它各种考试乘机上位，一些民办中学实施联考(张晓婷，2014)，一些公办中学根据学生的社会考试成绩(如剑桥少儿英语考试)录取学生，还有一些学校在录取学生时参照各种竞赛成绩和证书，如奥数分数、乐器演奏等级证书、书法证书等。有家长在自己的孩子进入初中后感叹道，“现在好了，只需瞄准中考，不必为了备考各种考试和证书而疲于奔命”。众所周知，有关高考改革的争议从未间断，有人甚至建议“取消全国统一考试，代之以各高校完全的自主招生”(参阅戴家干，2011)。该建议显然未被采纳，因为大规模考试涉及多方利益诉求，是社会大系统网络结构中不可或缺的一环。

由考试这条纽带关联起来的各方均有自身利益，利益之间的博弈而形成一种利益诉求格局，这便是考试的反拨效应或后效(washback or impact)。博弈会持续动态发展，当各方利益诉求得到关照时，各子系统相对平衡稳定。当利益发生冲突时，问题就会出现，引发各子系统进行调整或重组，以便相互适应，从而出现新的格局。例如，中学课程标准从未将高考和中考成绩设为教学目标，而初三和高三的应试教学却十分严重，这便是教学系统与考试和社会系统交互作用的结果。学校要适应学生和社会的需求，帮助学生获取高分考上大学，而大学也需要根据分数录取合格的学生。此外，如果考试对教学产生负面效应，遭到学校质疑和社会诟病，相关部门也会对考试进行调整以适应当下利益格局，争取考试的长期合理存在和顺利发展。因此，反拨效应的源头虽在考试，其演变却牵涉到考试、教学、教育、社会各子系统，所形成的格局随着子系统的互动而发生变化。换言之，考试与教学之间并非简单的线性因果关系。

4.0 考试与教学的非线性关系

考教之间的非线性因果关系符合动态系统的特征，体现在教学和考试中。例如，表面上看，高风险考试具有强大的导向作用，考什么学校就教什么，怎样考就怎样教，这折射出一种线性因果关系。但有研究发现，决策者所期望的反拨效应难以实现(Wall & Alderson,1993;Cheng,2005), 且与实际反拨效应相去甚远，并非考试怎样考学校就一定怎样教(亓鲁霞，2007)。为了有效提高考试分数，教师会根据自己对考试的理解去制定教学计划和调整教学方法，其做法不一定反映考试所承载的期望教学理念。显然，考教之间并非线性相关。

值得注意的是，以往的反拨效应研究多半停留在线性思维上，而研究结果却印证了反拨效应的非线性特征。一个典型的例子是Alderson & Wall(1993)的研究。他们在1993年发表了两篇学术影响颇大的反拨效应研究论文，提出了关于反拨效应的15个假设，涉及考试影响教学的各个层面。这些假设均建立在考试直接影响教学的因果关系之上，并在这样的思路引导下，Wall & Alderson(1993)开展了一项实证研究，检测考试决策者的意图，勾勒出期望反拨效应(即正面效应)，同时预测潜在的负面效应。结果发现，在教学内容与校本测评层面，正、负面反拨效应兼而有之，在教学方法层面，反拨效应并未显现。据此，Wall & Alderson(1993:68)指出，15个假设“过于简单化，需要进一步讨论、修正、研究”。

其它反拨效应研究设计也不同程度地遵循简单的线性思维。这些研究大多采用对比分析方法，试图揭示考试与教学的直接联系，如比较考试前后的教学状况(Cheng，2005)，比较不同考试对教学的影响(Shohamy et al.，1996)，比较期望反拨效应与实际反拨效应(亓鲁霞，2004)，比较备考与常规教学(Alderson & Hamp-Lyons，1996；Green，2006)。然而，研究结果却无一例外地表明，反拨效应是一个极其复杂的现象，与教育环境中诸多因素有关(Alderson & Hamp-Lyons，1996；Cheng，2005；Green，2006；Shih，2010；Xie, 2010；Wall，1996)。由于这些发现，研究者们尽管已经认识到反拨效应的复杂性，但多半仍受线性思维的支配，对反拨效应的解释还停留在对各种相关因素的列举上，难以厘清各因素之间以及它们与考试之间的互动关系。所列举的因素包括教学环境，教师、学生、甚至家长对考试的了解与认同，教师的学历、水平、教学经验，学生对待考试的态度，他们的学习动机和策略等 (Alderson & Hamp-Lyons，1996; Cheng,2005；Cheng et al.,2011；Green，2007，Gosa，2009；Xie，2010;Watanabe，1996；亓鲁霞，2004)，而这些因素与考试发生多重交互，并非各自与考试线性相关。

正确认识考教之间的非线性因果关系十分必要，有助于解释因考试而发生的一些现象，如“蝴蝶效应”。在复杂系统中，由于促变原因与后续结果的关系通常是非线性的，在各个子系统内部及外部因素的互动过程中，一个小事件有可能导致反拨效应成倍放大，引发蝴蝶效应。以高考英语中单句语法多选题为例，此类试题在整份试卷中连续多年仅占10%，但在社会各方利益的驱动下，高三学生在备考时却要做几千道这样的选择题，教师反复讲解各种语法规则和易犯错误(亓鲁霞，2004)。Xie(2010)也发现许多学生采用题海战术备考大学英语四级考试。考试的蝴蝶效应可见一斑。

考教之间存在蝴蝶效应意味着，反拨效应的强度具有不可预测性，反拨效应格局也并非一成不变，而是随着时间的推移而持续变化，体现了复杂系统的动态特征。例如，1985年高考英语改革初期，试卷增加了读写技能考试，带来较好的正面反拨效应，高中英语教学中出现了一些接近语言真实使用的活动，如读英文报、听英语广播等(Li，1990)。但是，该效应未见延续，后来的阅读和听力训练完全效仿考题，采用清一色的多项选择题，甚至有学校取消了英语课本中原有的阅读简答题和讨论题，为每一篇课文配上多项选择题进行训练(亓鲁霞，2004)。由此可见，在应试大潮的冲击下，一旦找到备考方法，考试原本产生的正面效应可能变成无益于学习的负面效应。这种变化与下面要讨论的考试风险不无关系。

5.0 反拨效应与考试风险的动态变化

考试的风险由教育系统和社会巨系统中各利益群体的交互作用决定，处于不断变化之中，由此引发的反拨效应也波动不断。在考生、教师、学校、家长眼中，那些用于做出重大决定的考试属于高风险考试(Madaus，1988)。一个考试的风险越高，其反拨效应就越强，反之亦然。考试用途可分为两类，一是原本用途，一是附加用途。原本用途与考试设计的初衷和目的一致，附加用途则偏离甚至违背考试的原本目的，有学者称之为考试滥用或误用(杨惠中、桂诗春，2007)。考试用途直接影响到核心涉考群体的利益(亓鲁霞，2011)。以高考为例，考试结果若仅用于高校招生，核心涉考群体就是考生和家长，如果还用于评价教师和学校，教师和学校管理人员也成为核心涉考群体。一个考试的用途和核心涉考群体越多，其风险就越高，反拨效应也越强。

考试用途、核心涉考群体、考试风险以及反拨效应之间的互动关系可在大学英语四、六级考试的发展过程中得到印证。该考试实施之初，考分不针对任何涉考者做出重要决定，考试风险自然较低。因为考试的初衷是促教促学英语，所以考分仅限于为教学提供反馈信息，供师生参考，这是考试的原本用途。随着时间的推移，考试衍生出各种附加用途。大学管理层利用考分管理学生，将英语四、六级考试成绩与毕业证书和学位颁发挂钩。此举引起应试教学，教学秩序受到影响，负面反拨效应显现，以至于教育部明确叫停挂钩(吴启迪，2005)。此外，四、六级英语成绩还被推广到社会上用于招聘员工，进一步推高了考试的风险，引来社会对此考试的诸多争议。由此可见，在教育系统非考试因素和社会大环境因素的共同作用下，四、六级考试从低风险考试逐渐向高风险考试转变，此演变过程佐证了DST的动态观。

考试风险的动态特征还有一种表现：同一考试的风险因涉考群体和个体的差异而有所不同。以PISA为例，考试成绩既不向参加考试的学生报告，也无评教功能，因此，学生、教师、学校管理人员都不是核心涉考群体。在他们看来，PISA应属低风险考试。然而，对于各国领导人，PISA却是高风险考试，因为每次考试结果的排名与公布，都把他们推向了基础教育质量比拼的前台，成为世界各国公众关注的焦点。例如，2000年的PISA结果显示，在参加测评的国家当中，挪威的人均教育投入最高，但学生成绩却低于平均分，这在挪威国内引起震动(称为PISA Shock)，成为反对党手中的“武器”，德国和丹麦也有类似情况发生(Stobart & Eggen,2012;Baird et al.,2011)。这种现象表明，同一考试给不同的涉考群体带来不同的风险。

对于同一涉考群体中的不同个体，同一考试的风险也可能不一样。以大学的期末考试为例，在大多数学校，期末考试分数通常计入学生的总成绩，决定学生能否毕业。我国大学一般都严进宽出，校内考试要求不高，极少学生不及格，对于多数学生来说，期末考试算是低风险考试。但是，一些成绩拔尖的学生特别重视此类考试，力争每次考分名列前茅，因为考试成绩可能用于评优发奖，还有利于将来申请国外留学。对于他们，校内的每次考试都可能是高风险考试。高考也存在类似情况。由于保送生制度的存在，在高考之前，一些高三优秀生通过保送便确定了要上的大学，参加高考通常是听从学校安排，取得好成绩只是为学校争光。对于他们，在备考多年之后，高考突然变成了低风险考试，因为成绩不再决定他们的前途。由此可见，考试风险取决于考试结果的用途，而反拨效应与考试风险紧密相关。

6.0 对未来研究的建议

前面的分析表明，反拨效应产生的过程具有动态系统的主要特征，将DST引入考试反拨效应研究是必要和理性的，能为深化反拨效应研究打开新的空间，未来的反拨效应研究不妨参照DST理论和方法进行。DST研究方法可在文献中找到，如在Larsen-Freeman & Cameron (2008)介绍的时间序列个案法中(longitudinal,case-study,time-series approach)，历时研究受到推崇。此法强调在较长的一段时间内观察研究对象，发现和确定时间序列，抓住收集数据的最佳时机。动态系统有变化周期，捕捉到变化的时间节点很重要，有助于决定数据样本采集的时间间隔(sampling intervals)，从而获得可靠有效的数据。反拨效应研究的一些重要时间节点包括考试建立之前、开考之初以及实施改革之时。在这些节点首次收集到的数据，可跟后续多次收集到的数据进行纵向比较，有助于准确勾勒反拨效应的演变轨迹，供相关考试决策机构调整和优化考试系统，弘扬正面反拨效应，消弭负面反拨效应。

迄今，绝大多数外语测试反拨效应研究采用一次性收集数据的方法，虽有不少发现，但缺乏系统深入的探讨。例如，文献中有大量针对大学英语四、六级考试开展的反拨效应研究，多是各自为战，数据收集一次过，难以获得反拨效应演变的概貌。高考和中考英语的反拨效应研究也存在同样的问题。而有“中文托福”之称的汉语二语考试HSK却鲜见反拨效应研究(黄春霞，2013)。针对这些大规模语言考试开展反拨效应研究，需要多方合作，特别需要相关考试机构牵头策划，将反拨效应研究纳入考试的常规工作，设立科研项目，聘用内行的研究者，定期收集数据，长期跟踪调查。如此方能把握大规模高风险考试与教学等多因素的互动演变，及时发现并最大限度地消除考试给教学带来的负面效应，为考试的持续开展或改革提供有用的反馈信息，不断开创考试研究的新局面。

注释：

① 本文作者参考了相近学科(如二语习得研究、教育学)的相关文献(如Larsen-Freeman，1997；de Bot et al.，2007；de Bot & Larsen-Freeman，2011；Verspoor et al.,2011;周志平,2005;冯永刚,2007;李兰霞,2011)。

[1] Alderson, C. & D. Wall. Does washback exist?[J].AppliedLinguistics, 1993,2:115-129.

[2] Alderson, J. C. & L. Hamp-Lyons. TOEFL Preparation Courses: A Study of Washback[J].LanguageTesting, 1996,3:280-297.

[3] Amrein, A. & D. Berliner. High-stakes testing, uncertainty, and student learning[J].EducationPolicyAnalysisArchives, 2002,18:1-74.

[4] Bachman, L. & A. Palmer.LanguageAssessmentintheRealWorld:DevelopingLanguageTestsandJustifyingTheirUse[M]. Oxford: Oxford University Press, 2010．

[5] Baird, J., T. Isaacs, S. Johnson, Stobart, G. Yu, G., Sprague, T．& R. Daugherty.PolicyEffectsofPISA[M]. Oxford University Centre for Educational Assessment, 2011．

[6] Cheng, L.ChangingLanguageTeachingThroughLanguageTesting:AWashbackStudy[M]. Cambridge: Cambridge University Press, 2005．

[7] Cheng, L., S. Andrews. & Yu, Y. Impact and consequences of school-based assessment(SBA): Students’ and parents’ views of SBA in Hong Kong[J].LanguageTesting, 2011,2:221-249.

[8] de Bot, K. & D. Larsen-Freeman. Researching second language development from a dynamic system theory perspective[A]. In M. H. Verspoor, K. de Bot & W. Lowie (eds.).ADynamicApproachtoSecondLanguageDevelopment[C]. Amsterdam: John Benjamins，2011.5-23.

[9] de Bot, K., W. Lowie & M. Verspoor. Dynamic Systems Theory and approach to second language acquisition[J].Bilingualism:LanguageandCognition, 2007,1:7-21.

[10] Dörnyei, Z. Researching complex dynamic systems: “Retrodictive qualitative modelling” in the language classroom[J].LanguageTeaching, 2014,1:80-91.

[11] Frederiksen, J. R. & A. Collins. A systems approach to educational testing[J].EducationalResearcher, 1989,9:27-32.

[12] Gosa, C. M. C.InvestigatingWashback:ACaseStudyUsingStudentDiaries[M]. Saarbrücken: VDM Verlag Dr. Muller, 2009.

[13] Green, A．Watching for washback: observing the influence of the international English language testing system academic writing test in the classroom[J]．LanguageAssessmentQuarterly, 2006,3:333-368.

[14] Green, A.IELTSWashbackinContext:PreparationforAcademicWritinginHigherEducation[M]. Cambridge: Cambridge University Press, 2007．

[15] Larsen-Freeman, D. Chaos/ Complexity science and second language acquisition[J].AppliedLinguistics, 1997,2:141-165.

[16] Larsen-Freeman, D. & L. Cameron. Research methodology on language development from a Complex Systems perspective[J].TheModernLanguageJournal, 2008,2:200-213.

[17] Li, X. How powerful can a language test be? The MET in China[J].JournalofMultilingualandMulticulturalDevelopment, 1990,5:393-404.

[18] Linn, R. L. Assessments and accountability[J].EducationalResearcher, 2000,2:4-16.

[19] Madaus, G. F. The influence of testing on the curriculum[A]. In Tanner, L. N.(ed.).CriticalIssuesinCurriculum:Eighty-seventhYearbookoftheNationalSocietyfortheStudyofEducation[C]．Chicago: University of Chicago Press, 1988.83-121.

[20] Nolen, S. B., T. M. Haladyna & N. S. Haas. Uses and abuses of achievement test scores[J].EducationalMeasurement:IssuesandPractice, 1992,2:9-15.

[21] Popham, W. J., K. L. Cruse, S. C. Rankin, P. D. Sandifer & P. L. Williams. Measurement-Driven Instruction: It’s on the road[J].PhiDeltaKappan, 1985,9:628-634.

[22] Shih, C. The washback of the General English Proficiency Test on university policies: A Taiwan case study[J].LanguageAssessmentQuarterly, 2010,3:234-254.

[23] Shohamy, E., S. Donitsa-Schmidt & I. Ferman. Test impact revisited: Washback effect over time[J].LanguageTesting, 1996,3:299-317.

[24] Stobart, G. & T. Eggen. High-stakes testing-value, fairness and consequences[J].AssessmentinEducation:Principles,Policy&Practice, 2012,1:1-6.

[25] Strauss, V. 50 ways adults in schools “cheat” on standardized tests. Retrieved at http://www.washingtonpost.com/blogs/answer-sheet/wp/2013/03/31/50-ways-adults-in-schools-cheat-on-standardized-tests/. [2014-02-25]

[26] Verspoor, M. H., de Bot, K, & Lowie, W.(eds.).ADynamicApproachtoSecondLanguageDevelopment:MethodsandTechniques[M]. Amsterdam: John Benjamins, 2011．

[27] Wall, D. Introducing new tests into traditional systems: Insights from general education and from innovation theory[J].LanguageTesting, 1996,3:334-354.

[28] Wall, D. & J. C. Alderson. Examining washback: The Sri Lankan impact study[J].LanguageTesting, 1993,1:41-69．

[29] Watanabe, Y. Does grammar translation come from the entrance examination? Preliminary findings from classroom-based research[J].LanguageTesting, 1996,3:318-333.

[30] Xie, Q.TestDesignandUse,Preparation,andPerformance:AStructuralEquationModelingStudyofConsequentialValidity[D]. Phd Dissertation, The University of Hong Kong, 2010.

[31] 戴家干. 坚持公平公正，深化高考改革[J]. 求是，2011(2)：57-59.

[32] 冯永刚. 复杂科学视域下的德育评价[J]. 外国教育研究，2007，(11)：40-43.

[33] 桂诗春，李筱菊，李崴. 英语标准化考试试验的回顾与总结[A]. 肖惠云主编. 英语标准化考试与中学英语教学[C]. 广州：广东教有出版社， 1988.37-63.

[34] 黄春霞. HSK对汉语作为第二语言教学中学习行为的反拨效应[J]. 云南师范大学学报(对外汉语教学与研究版)，2013，(1)：10-17.

[35] 李兰霞. 动态系统理论与第二语言发展[J]. 外语教学与研究，2011，(3)：409-421.

[36] 亓鲁霞. 意愿与现实：中国高等院校统一招生英语考试的反拨作用研究[M]. 北京：外语教学与研究出版社，2004.

[37] 亓鲁霞. 高考英语的期望后效与实际后效——基于短文改错题的调查[J]. 课程·教材·教法，2007，(10)：43-46.

[38] 亓鲁霞. 语言测试的反拨效应理论与实证研究[J]. 外语教学理论与实践，2011，(4)：23-28.

[39] 吴启迪. 教育部副部长吴启迪同志在大学英语四、六级考试改革新闻发布会上的讲话[J]. 外语界，2005，(2)：2-4.

[40] 杨惠中，桂诗春. 语言测试的社会学思考[J]. 现代外语，2007，(4)：368-374.

[41] 杨惠中，C. Weir. 大学英语四、六级考试效度研究报告[M]. 上海：上海外语教育出版社，1998.

[42] 张晓婷. 广州中小学毕业考试、民办初中联考时间表敲定6月26日、27号. http://www.gdzsxx.com/zxx/zkdt/35731.html. [2014-12-22].

[43] 周志平. 复杂科学在教育研究中的方法论意义[J]. 教育理论与实践，2005，(4)：1-5.

A Study of Washback in Light of the Dynamic Systems Theory

WANG Chu-ming, QI Lu-xia

(Center for Linguistics and Applied Linguistics,Guangdong University of Foreign Studies, Guangzhou 510420, China)

The Dynamic Systems Theory (DST) is gaining popularity in humanity studies nowadays. However, little research has been found in its application to the study of language test washback. Following an introduction to the basic tenets of DST, this paper sets out to justify the use of the theory to enquiry into washback. Analysis shows that washback bears features that tally with the dynamic systems and therefore drawing on the DST to study washback is highly justified. Research along this line is innovative and conducive to a better understanding of the mechanism relating to the generation of washback effect. Furthermore, DST-based research has the potential to move forward washback studies and contribute to mitigating the negative effects associated with teaching to the test.

The Dynamic Systems Theory; washback; non-linear causal relationship; test stakes

2016-02-20

本文为国家社科基金项目“汉语二语学习的认知过程与高效率教学模式研究”(项目编号：12&ZD224)的部分成果。

王初明，汉族，博士，教授。研究方向：二语习得。

10.16482/j.sdwy37-1026.2016-04-005

H319

1002-2643(2016)04-0035-08

亓鲁霞，汉族，博士，教授(退休)。研究方向：语言测试。