APP下载

二语写作词汇复杂度动态发展个案研究

2021-11-08朱慧敏刘艳梅

山东外语教学 2021年5期
关键词:二语复杂度变异

朱慧敏 刘艳梅

(1. 山东财经大学 外国语学院, 山东 济南 250014;2. 山东财经大学 公共外语教学部, 山东 济南 250014)

1.0 引言

词汇复杂度作为二语写作研究的重要维度,已引起众多学者的兴趣。近年来,随着复杂动态系统理论(Complex Dynamic Systems Theory,简称CDST) 在应用语言学领域的运用,学者越发重视个体学习者语言系统内部子系统的动态发展过程及其细节变化特征,这样更易于考察群组发展趋势所遮掩的个体发展过程中的本质属性—变异性 (Lowie & Verspoor,2015 )。在二语写作研究领域,通常以“词汇丰富性(lexical richness)” (Read,2000:200)来衡量学习者词汇复杂度情况。词汇丰富性包含词汇密度(lexical density,LD)、词汇变化性(lexical variation,LV)和词汇复杂性(lexical sophistication,LS)等多个变量,其发展过程具有复杂系统的所有特征,因此Skehan(2009)把二语词汇系统纳入语言发展框架中。现有二语写作词汇发展相关研究体现了词汇发展过程的非线性和高原期特征(如Muncie,2002),但是它们大多是对词汇相关变量的均值研究,历时个案词汇动态发展研究相对不足。CDST将二语发展视为一个动态、开放、全面联结、自适应的系统(de Bot & Larsen-Freeman,2011),明确提出只有通过对个案追踪,方可揭示系统内部指标间的微观关联作用及其不同指标在不同时间点的动态变化特征(Larsen-Freeman & Cameron,2008;Lowie & Verspoor,2015)。CDST为历时个案研究提供了理论基础,研究方法亦日趋成熟,使研究更具“科学性和规范性”(李兰霞,2017:73)。鉴于此,本研究以CDST为理论框架,运用其可视化数据处理技术,考察2位英语初始水平相当的非英语专业大学生四个学期完成的英语议论文,并辅以回溯式访谈,追踪研究其词汇复杂度内部指标动态发展特征并剖析原因,旨在为二语写作教学与研究提供新的思路和启示。

2.0 文献综述

21世纪以来,二语写作词汇发展实证研究相继展开,主要聚焦于词汇复杂度或词汇丰富性。这些研究大致可分为四类:(1)通过横向或纵向对比,考察不同年级学习者二语写作的群体词汇发展特征,发现“词汇变化与年级水平之间呈非线性关系”(秦晓晴、文秋芳,2007:89);“词汇复杂性能区分不同水平学习者词汇使用的差异”,词汇密度及其变化性呈非线性发展(鲍贵,2008:38);“词汇变化性呈非线性发展”,且出现词汇高原期,相邻年级间的词汇复杂性有显著性差异(朱慧敏、王俊菊,2013:77);初中生的词汇丰富性“随年级升高而不断提高,各维度发展不均衡”(张会平,2020:529)。(2)基于CDST,通过追踪不同水平的学习者,研究二语写作词汇与句法之间的动态发展特点,发现个体间词汇复杂度变异特征、个体内词汇和句法复杂度指标间的变异特征及其联动模式不尽相同 (Larsen-Freeman,2006;Spoelman & Verspoor,2010;Lowie et al.,2017;郑咏滟,2018)。(3)追踪一组或两组学习者,从中选取不同个案的不同指标,分析词汇系统的动态发展特征。研究发现二语写作的词汇发展具有明显的动态曲折多变性,但随着学习者水平的提高,词汇各维度之间“支持—竞争”的关系会发生转换 (郑咏滟,2015;白丽芳、叶淑菲,2018),词汇密度、词汇变化性和词汇复杂性之间存在复杂的交互关系(Kalantari & Gholami,2017)。这些研究虽涉及个案数据分析,但并非历时个案追踪研究。(4)通过个案追踪母语为非汉语的英语学习者,观察词汇知识的动态发展变化。研究结果表明,词汇多样性和句子复杂性的进步与退步交替出现;非线性发展与学习者个体内部因素变化相关(Verspoor et al.,2008);词汇子系统之间存在支持、竞争的交互发展关系(Caspi & Lowie,2013);即使家庭背景、语言输入和个体特征极其相近的孪生姐妹,随着英语学习时间的推移,其产出性词汇发展趋势也表现出异质性(Chan et al.,2015)。

上述文献对二语写作的词汇发展进行了积极探索,为该领域做出了重要贡献,但还存有以下研究空间:一是国内较早期的二语写作词汇发展研究,追踪的大多是群组学习者的二语写作,所得结论也只能说明整体词汇发展情况,对个体学习者说服力不强,对二语写作教学的启发意义也受限。二是近期的研究多以揭示二语写作中词汇复杂度的某一个维度与其它语言子系统的关联发展特征为主,指标选取存在单一性,研究结果的效度受到影响。三是“对研究结果的阐释多基于理性分析和主观推断”(朱慧敏,2021:104),而基于学生回溯访谈和文本分析,深度挖掘影响学习者二语写作词汇动态发展因素的研究十分有限。四是以中国大学生为研究对象,基于CDST进行二语写作的词汇复杂度多维度历时个案发展研究尚不多见,对初始水平相当的大学生进行追踪研究更是凤毛麟角。

3.0 研究设计

3.1 研究问题

本文具体探讨以下问题:

(1) 二语写作中词汇复杂度各指标呈何种发展轨迹?其发展过程是否存在变异性?

(2) 二语写作中词汇复杂度各指标之间是否存在联动发展?有何特征?

3.2 研究对象

本研究的对象是国内某省部共建高校非英语专业本科学生。取学习者高考英语成绩、新生入学和研究伊始的第一篇英语写作成绩的平均分,将全班48位学生的成绩分为优(100分-90分,7人)、良(89分-80分,28人)、中(79分-70分,10人)、差(69分-60分,3人) 四个等级,然后从良好等级中随机选取学生YT和WX为受试,追踪研究其两个学年完成的英语写作中词汇发展情况。两位受试均为女生,年龄相同 (19岁),学习英语的年数相同(9年),大学同班,授课教师相同,皆无英语课外辅导和留学经历。“由于实证研究中难以确定学习者绝对意义的初始水平”(郑咏滟,2017:33),本研究采用Verspoor (2015:38)的定义,初始水平是指研究伊始学习者的语言水平,故两名受试可视为初始水平相当、具有良好英语写作水平的学习者。

3.3 语料收集与加工

研究语料选自两位学习者四个学期完成的24篇议论文。语料收集期间,本文作者之一为受试的大学英语教师,每次根据所学单元内容给学生提供两个写作话题,学生根据兴趣和可写性,任选其一,于30分钟内独立完成不少于150词的议论文(朱慧敏等,2021)。研究者现场收取作文,每5周收集一次,每学期3次,共收集12次。

鉴于本研究只关注词汇复杂度发展特征,按照词汇复杂度分析器(Lexical Complexity Analyzer,LCA)(Lu,2012)的使用要求,在将作文录入电脑过程中,为了尽可能确保各指标测量的准确性,研究者用相应的代词替换了阿拉伯数字、人名和地名等,删除了误用词汇,校正了拼写错误,最后保存文本,作为提取词汇复杂度测量指标的原始语料。

为了挖掘影响学习者词汇发展的因素,第四学期末对两位学生进行了半结构化回溯访谈,访谈内容涉及以下四个问题:(1)词汇在写作中是否重要,起到什么作用?(2)学习者更关注词汇使用的哪些方面?(3)学习者通过什么方式来习得词汇?(4)哪些因素影响词汇的使用?经受试同意,对访谈内容进行了录音并转写成文本,根据研究问题进行编码归类。

3.4 测量指标

词汇复杂度的测量,参考Read (2000:200)对词汇测量维度的分类和本研究语料的特质,选取 LD、LV和 LS三个指标。LD是指“实词在文本中所占的比率”(Read,2000:201)。LV传统上用类符与型符比( Type-Token Ratio,TTR)测量,但这种测量结果易受文本长度的影响,因此在相关研究领域遭到质疑(Duran et al.,2004)。平均分段的类符与型符比(Mean Segmental Type-Token Ratio,MSTTR)测量方法受文本长度影响较低,能进一步解决TTR测量的不足,其信度和效度已得到验证 (Torruella & Capsada,2013),故本文选用 MSTTR值测量LV。具体测量方法:把每篇文本分割成大小相同的几个块(如以50个单词为一块,长度为150词的文本则可分割为3块),每个部分用TTR计算,然后计算平均数,即可得到MSTTR。LS是指“文本中相对高级词汇的比例”(Read,2000:203),即2000个高频词以外的单词类符与文本总单词类符之比。

3.5 数据分析

数据分析主要使用LCA词汇分析软件和PopTools统计分析工具。 LCA的信度和效度已被相关研究所验证(Lu,2012)。根据研究问题,数据采集和分析步骤如下:(1)借助LCA,提取两位学生12次作文中的LD、LV、LS的原始数据,分别绘制3个指标的增长轨迹平面图和移动极值图。移动极值图的最大值和最小值之间的带宽,用来捕捉发展过程中的微妙变异,“带宽越大,变异度越大”(van Dijk et al.,2011:76)。移动极值图绘制方法如下:以3次连续测量数据为一个移动窗口(t1,t2,t3),计算第一组最大值和最小值,然后往后移动一个数据格,得到第二个窗口(t2,t3,t4),计算第二组最大值和最小值,依此类推。将最大值和最小值数据分别绘制折线图,两条折线间形成的宽度表示学习者语言变异的程度。 为了检验个体变异数据的显著性,借助PopTools模拟工具(Simulation tools)中的蒙特卡罗分析(Monte Carlo Analysis),进行再抽样概率检验,如果p<0.05,则说明局部波峰变异具有显著性。(2)为使数据具有可比性,对时间序列的3个指标进行标准化处理,使用Excel 2010以5次为一个移动窗口,绘制移动相关系数图,观测指标间联动发展轨迹(朱慧敏,2021)。(3)对回溯访谈内容进行手工整理和编码,并结合学习者文本,探究复杂动态系统中各因素如何联动,促使二语写作词汇动态发展特征涌现。

4.0 研究结果与讨论

4.1 发展及变异特征

词汇密度。对比YT 和WX的LD发展轨迹,发现YT的起始值较高,终点值也较高,但期间经历了升、降起伏及跌落的震荡,呈U型发展轨迹;WX的LD起始值较低,经历了降、升交替发展的过程,呈W型发展轨迹。二者的LD并未随时间的延续而显著增长,而是呈现进步、退步和止步共存的非线性和不可预测性发展特征(见图1)。

图1 YT、WX的LD发展轨迹和移动极值图 图2 YT、WX的LV发展轨迹和移动极值图

为检验LD发展过程中的局部波峰是否具有显著性,进行蒙特卡罗检验(van Dijk et al. , 2011),结果p=0.009<0.05(YT),p=0.84>0.05(WX),说明YT的局部峰值具有显著性变异,即YT的LD子系统在第11次打破了“吸态”(de Bot & Larsen-Freeman,2011:9)表面的平衡,通过自适应性发生了系统重组,涌现了系统的质变。

WX的LD发展也出现波峰(第7次),但未能冲破系统的吸引力发生质变,属于系统偶然波动。虽然没能打破“吸态”,但是并不意味着该状态永久不变。根据CDST,语言的发展没有终点,变化是系统发展的常态,未来系统中某个变量的细微变化,都可能带来整个系统的突变或相变(de Bot & Larsen-Freeman,2011)。这一研究发现与郑咏滟(2015)对学生OR的LD研究结果相一致,峰值未出现显著变异的原因可能是学习者二语写作中实词使用数量相对稳定,已提前进入“吸态”。纵观两者LD的极值图带宽,发现变异模式存在一定程度的相似性,均为初始阶段带宽较小,中期变大,后期趋窄,进入相对平稳的发展阶段。变异发展模式进一步验证了语言的发展是从一个“吸态”,经历非线性变异波动后,再到另一个“吸态”的过程 (李兰霞,2017:34;朱慧敏、刘艳梅,2019)。

词汇变化性。 图2所示,YT的LV起始值较高,前期在波动中呈非常下降趋势(1-6次),后期(8-12次)稳步正增长。WX的LV初期发展较平稳(1-4次),之后出现震荡(5-8次),最后呈现平缓上升态势(8-12次)。为检验局部峰值是否显著,同样进行蒙特卡罗检验,结果p=0.05(YT),p=0.12>0.05 (WX),可见YT的LV在发展中的波峰具有显著性,而WX的不具显著性。

图2极大值和极小值之间的带宽表明,尽管两者的LV变异区间存在相似性(最大带宽均在4/5-7次),但由于YT的局部变异具有显著性,系统进入新的“吸态”,YT的LV发生了质的变化,取得了更大进步,印证了新的吸引子是系统质变的标志,也是新事物涌现的标志(Larsen-Freeman,2017:424)。

WX的带宽前期处于稳定的“吸态”(1-4次),继而产生较大幅度波动,然后又进入“吸态”。这一发展模式证实了CDST的观点,说明语言发展并非线性,而是一个充满进步与倒退,循环往复的非线性发展过程(李兰霞,2017:34)。虽然发展轨迹显示WX的LV后期有了稳定提高,但由于其局部变异特征未呈现显著性,所以其第6次的峰值具有偶然性,系统尚未冲破“吸态”,未发生质变。

词汇复杂性。 图3 趋势线表明,两者的LS均在波动中发展。YT的LS前期下行,之后开始回升(第5次),后半阶段趋于平稳(6-12次),进入“吸态”;而WX的LS则波动较大,发展轨迹呈M型,后期发展呈下滑趋势(10-12次)。再抽样计算和蒙特卡罗检验,结果显示p=0.06>0.05 (YT),p=0.05 (WX),说明YT超出2000词表以外的低频词使用还不够,需要进一步加强扩大词汇量和对高级词汇的应用。而WX的LS局部峰值达到显著水平,表明系统经过重组达到临界点,产生了突变(de Bot & Larsen-Freeman,2011)。

图3 YT、WX的LS发展轨迹和移动极值图

两者的LS极值图的带宽体现了个体差异性。YT的带宽由宽(1-5次)变窄(6-12次),由波动趋于稳定,而WX的带宽几经波动,变异模式整体呈现无规律性。两位学生的LS变异特征与郑咏滟(2015)研究的OR和ZY的结果不完全一致,主要由个体差异性、外部因素和写作任务等的不同所致。LS发展的个体差异性进一步验证了Chan et al.(2015)和白丽芳与叶淑菲(2018)的研究发现,即使初始水平相当,学习环境相似的学习者,语言也会呈现不同的发展趋势。

回溯访谈和文本数据也进一步验证了上述研究发现。访谈发现,YT在写作中具有极强的词汇意识,她认为“书面文体不同于口语体,词汇需要更加准确,并要有一定的修饰性”,并且认为“词汇相对于句法,更容易提高”。受这种元认知的驱动,她对词汇使用的多样性进行了更多的关注,对信息资源进行了充分利用。如她非常注重从课堂学习和课外阅读中积累词汇,不仅在课堂互动中积极尝试新词汇,还在每次习作中“先打草稿,然后将低级的、重复的词汇替换为高级的、多样化的表达”。同时,教师对习作结果的反馈也影响学习者词汇学习资源的构建。如YT提到“教师批注时会特别标注好词”,并且“哪怕是错误的尝试,教师也给予肯定,并给出修改意见”,这使她更愿意冒险使用新学词汇,并在不断尝试和纠正中,词汇使用越来越准确得体。在学习者内外部多种因素(如元认知、输入资源、学习时间、教师反馈、反复练习、注意等)的合力作用下,YT的LD和LV都呈现局部显著变异性特征,产生了质的发展。

同样,WX的词汇发展也是多种资源共同作用的结果。访谈中,她提到“词汇发展的动力源于教师的引导”,她认为“基本的句法高中已经学过,作文质量要提高,应将更多精力放在词汇发展上,尤其是一些高级词汇”。为了习得高级地道的词汇,她一直坚持课外广泛阅读,做词汇笔记,并在习作中有意识运用。经过努力,WX的LS发展两学年期间呈现显著性变异,说明其作文中超出2000个基础词之外的高级词汇有了质的提高。文本分析也印证了这一点,以WX习作的“机器人是否能代替人类”一文为例,出现了如sensitivity,entertainment,heredity,sparkle,evolution,persistence,insensitive等多个低频词。WX词汇使用质量的提高得到了教师积极的反馈,使她获得了良好的写作体验,更加坚定了她使用高级词汇的信心。可见,学习者的内驱力和外在的语言输入、教师反馈使WX的LS在输出中得以显著发展,而词汇使用的进步又反过来促进了学习者习作的态度和成就感。

综上,“学习者内在的元认知、动机、注意、学习时间、记忆能力等以及外在的信息资源、鼓励、反馈等,共同构成了二语学习者的认知生态系统”(van Geert,1995:315)。这些资源并非孤立地作用于学习者的语言发展,在时间发展序列中,资源之间相互影响,系统与资源之间相互协调和适应,呈现双向因果关系(Larsen- Freeman & Cameron,2008)。学习者自身体验与不同阶段的环境互动,加之可利用资源的迭代作用,使他们语言子系统内部不断变化和重组,更高更复杂的词汇在使用过程中逐渐涌现。学习者内在的个体差异、外在环境的不同,以及语言系统与内外部资源交互的差异,产生了个体语言使用的独特性和语言特征变异的差异性。

4.2 联动发展特征

词汇密度与词汇变化性。图4表明YT的LD与LV在发展过程中呈现“强支持—弱支持—中度支持”的联动模式。WX的LD与LV在发展过程中也表现出整体相互支持的关系,呈现强支持和弱支持交替发展的模式。移动关联发展轨迹显示两个指标间的关系并非静态,而是在时间序列中呈现动态变化,但是在不同时间节点上相互支持发展的强度不一。整体而言,两位学生的这两个指标是一对相互适应、相互依赖、共同发展的子系统,形成了一对“关联生长点”(Lowie et al.,2011:108)。

图4 学生YT、学生WX的词汇复杂度关联发展轨迹

词汇密度与词汇复杂性。图4表明YT的LD与LS在发展过程中除第1个窗口出现支持关系外,其余窗口均显示竞争关系,表明两个指标在发展过程中,虽有波动,但一直处于竞争状态(第1个窗口除外)。WX的LD与LS之间呈现“竞争—支持”的关系,前期高度竞争(1-4个窗口),后期发展为相互支持的关系(5-8个窗口)。WX的后期发展联动模式与Kalantari & Gholami(2017)的研究结果相一致,但与YT的不同,体现了个体系统内部指标联动发展的差异性。

词汇变化性与词汇复杂性。YT的LV与LS之间除 1-2个窗口处于支持状态外,其余均处于竞争状态,与其LD和LS之间表现出相似的联动发展模式,即“支持-竞争”模式;而WX的LV和LS的联动发展模式与YT的截然相反,呈现“竞争-支持”的关系,由最初的强竞争(第1个窗口)发展为弱支持(2-5个窗口)再到强支持(6-8个窗口)。这说明YT 的 LV和LS的交互发展特征在研究期间主要表现为一个变量的增长以另一个变量的下降为代价,而WX的LV和LS则主要体现为相互促进、共同发展。

综上,两位学习者LS与LD和LV之间均表现出既有竞争也有支持的联动发展模式,这可以从Skehan(1998)的平衡假说(trade-off hypothesis)理论得到解释。在二语习得过程中,学习者不能将有限的注意力和大脑加工资源均等地分配给语言的不同子系统,这种资源分配的不平衡导致指标间出现此升彼降、相互竞争的发展模式。从访谈数据可以看出,YT将更多的精力放在“避免词汇重复”,力求词汇“多样性”上。她在发展LD和LV的同时不能兼顾LS的发展,从而出现指标间相互竞争的发展模式,同时表明她的书面语产出能力尚有较大的提升空间。WX则更加关注“高级词汇”的使用,力求用词新颖,受语言能力所限,前期虽无暇兼顾LD和LV同时发展,产生资源竞争,但后期随着语言能力的提升,认知资源的分配逐步达到均衡,3个指标间呈现相互支持、协同发展。

本研究结果进一步表明,系统与学习者内外部环境之间、系统内部各组成部分之间具有相互联结性(de Bot & Larsen-Freeman,2011:18),一个指标的细微变化可能会带来其它指标甚至整个系统的变化,并且语言子系统的联动效应会随着时间的变化而变化。

5.0 结论与启示

本研究基于CDST,采用时间序列的数据分析方法,对两位初始语言水平相当的非英语专业大学生写作中词汇复杂度发展进行了纵贯研究。研究发现,两位学习者词汇复杂度的不同指标发展轨迹不尽相同,具有非线性、变异性和个体差异性特征;各指标间发展模式存在关联性和异步性,词汇密度和词汇变化性为一对关联生长点,学习者内外资源的联动与词汇系统的发展互为因果,资源交互方式的差异造成学习者写作发展变异的差异,资源的有限性及资源的分配方式是形成词汇内部指标竞争与支持联动模式的主要原因。

本研究发现对外语教学有一定的启示和指导意义。首先,研究表明变异性是二语写作词汇复杂度发展的属性,也是词汇系统发展的内在动力,当学习者不断尝试新的词汇知识时,二语写作中有可能出现词汇使用不当或使用错误等现象,这是学习者要突破“吸态”,进入新的发展期的表现,教师如果予以鼓励,给予及时的纠正,学习者若得到积极的反馈,会加速学习者语言系统质变的发生。其次,即使初始水平相当的学习者,词汇系统的发展轨迹和交互模式也表现出了极大的差异性,所以教师在关注群体发展趋势的同时,更要充分尊重个体间的差异性,促进二语写作个性化发展。再次,教师应充分认识到二语写作词汇系统的发展与学习者内外部资源互为因果。提升学习者对二语写作标准的认知,从课程、教材、课外阅读等多渠道增加外部输入,促进词汇量增长,加强读后续写,增强对语言的使用,从而构建利于学习者提高语言水平的内外部环境和资源,最大限度地提升写作能力。

本研究主要从CDST和其特有的研究方法分析学习者产出性词汇动态发展变异的原因。随着第二语言发展相关理论和方法的不断拓展,有关二语写作发展研究在理论依据和研究方法层面将有更加宽阔和深入的探究空间。

致谢:感谢山东大学王俊菊教授和匿名审稿专家为本文提出的宝贵修改意见和建议。

猜你喜欢

二语复杂度变异
中国大学EFL班级的二语自我分型特征分析
二语习得理论对初中英语课外阅读教学的实践探索
基于L2MSS理论的职业英语二语动机策略干预研究
变异危机
变异
一种低复杂度的惯性/GNSS矢量深组合方法
The Application of Interaction from Sociocultural Perspective in English Teaching Classroom
求图上广探树的时间复杂度
某雷达导51 头中心控制软件圈复杂度分析与改进
变异的蚊子