APP下载

典型相关分析及其在外语教育研究中的应用

2012-10-28李光泽

关键词:学习动机典型外语

李光泽

(福建师范大学 外国语学院,福州 350007)

典型相关分析及其在外语教育研究中的应用

李光泽

(福建师范大学 外国语学院,福州 350007)

定量实证研究在我国外语教育研究领域取得了长足的进步,但也暴露了方法论方面的一些问题,因而加强外语教育研究方法论的训练仍是一项长期而艰巨的基础性工作。通过介绍典型相关分析(Canonical Correlation Analysis)并结合实例详细讨论其在外语教育研究中的具体应用表明,作为研究两组变量相关关系的多元统计分析方法,典型相关分析在处理两组变量的相关性问题上明显优于简单相关分析、多元回归分析和因素分析。而且,由于外语学习过程的多因素特征,典型相关分析在外语教育研究领域具有广阔的应用前景。

典型相关分析;基本原理;SPSS软件操作;外语学习;外语教育研究

一、引言

桂诗春和宁春岩曾对我国《外语教学与研究》《外国语》《外语界》《现代外语》等四本外语类核心期刊中的755篇文章加以统计和分析,结果发现80%的文章不依赖数据,大多使用简单的思辨方法[1],而同一时期西方应用语言学的主流研究方法却是定量研究或者说是基于数据的[2]。我国外语研究者的成果难登大雅之堂,其中最为根本的原因是缺乏方法论,尤其是研究设计与统计分析方面的训练。随着一些高校研究方法及统计学课程的陆续开设,以及相应的研究方法和统计教材的出版(如桂诗春、宁春岩的《语言学方法论》,刘润清的《外语教学中的研究方法》,文秋芳的《应用语言学研究方法与论文写作》,李绍山的《语言研究中的统计学》等),我国外语教育的定量实证研究取得了长足的进步,对外语类核心期刊(2000—2009年)的最新统计显示定量实证研究在我国外语教育研究中处于主导地位[3]。然而,一些研究也暴露了严重的统计误用或乱用现象,其中有统计方法运用不恰当问题[4-5],甚至出现虚构统计推断结果问题[6]。可见,加强我国外语教育研究方法的教学与训练依然任重道远。

典型相关分析(Canonical Correlation Analysis)是研究两组变量之间相关关系的多元分析方法。早在1936年,Hotelling就首先提出这种方法的基本思想和分析框架[7]。然而,典型相关分析的实际应用是直到统计软件的问世之后才开始的。虽然,典型相关分析目前已经在教育学、心理学、行为科学和社会学等领域得到广泛的应用,但在外语教育研究领域的具体应用屈指可数。不过,随着外语教育研究的深入,需要纳入考察的因素将不断增加,典型相关分析的应用也会越来越广泛。外语学习不仅涉及语言能力和语用能力的中介语系统,还受到智力、年龄、性别、学能、动机、策略、风格等学习者内部因素以及包括社会环境、家庭环境、学校环境、课堂环境和教学方法的学习者外部因素的影响[8],这就意味着外语教育研究必然要考察这些因素和它们之间可能存在的关系,及其对外语学习者语言能力发展的影响。可以预见,涉及多个因素或多个变量的典型相关分析在外语教育研究领域具有广阔的应用前景。本文的目的在于介绍典型相关分析的基本思想、适用对象和范围以及具体的SPSS统计软件操作,并结合一项有关外语学习的研究案例剖析典型相关分析的实际应用。

二、典型相关分析概述

在外语教育研究中,需要研究两组变量之间关系的情况颇为常见,例如外语学习的学习观念与学习动机的关系研究[9],其中,学习观念包括语言学习的价值与性质、讲话的自信心、正式的结构学习、语言学习能力等4个维度,学习动机含有自我效能、功利性行为目标、工作-回避目标倾向、掌握目标倾向、自我与社会行为目标、控制焦点等6个维度。又如英语学习者学习策略与课堂行为之间的关系研究[10],同样涉及两组变量,其中,学习策略包括记忆策略、认知策略、补偿策略、元认知策略、情感策略、社会策略等6个方面,课堂行为包括口头参与、学习取向、争强好胜、寻求帮助、自我表露、自信、与同学交往等7个方面。

要探讨上述研究中两组变量之间的关系,哪种数据分析方法最为合适呢?根据 Cooley和Lohnes《多元数据分析》一书的相关讨论[11],可以尝试以下几种统计分析方法。第一种是使用简单相关分析(simple correlation)来确定两组变量中各个变量之间的相关程度,两组中各变量之间的相关程度可能很高,但其结果无法使我们理解两组变量之间的整体性、实质性关系。第二种是多元回归分析(multiple regression),即以第一组变量为预测变量,另一组中的一个变量为被预测变量。这种分析方法需要多次运行回归分析,不足之处是多次操作多元回归分析难以避免统计中一类错误(TypeⅠerror)的产生,同时也仅仅考察了两组变量在一个方向上的关系。第三种分析方法是先分别进行组内的因素分析(factor analysis),然后用产生的因素分数做相关分析。这种分析方法也有较大局限性,因为因素分析只关心抽取组内的共同变异(common variance),对于可能出现确定两组变量关系至关重要的特定变异(specific variance)没有抽出,因此有可能导致构成两组变量共同变异的一些重要成分的丧失。

典型相关分析能够克服以上统计分析方法的诸多不足,凸现分析这类变量组之间关联程度的优越性。典型相关分析方法探究的是两组变量之间整体的线性相关关系,即将每一组变量视为一个整体加以考察而不是分析组内各个变量。从理论上讲,典型相关分析借用了主成分分析(Principal Components Analysis)降维的思想,分别对两组变量抽取主成分,然后使得两组变量所抽取的主成分之间的相关程度最大化,而同一组内抽取的各主成分互不相关。典型相关分析正是利用其中两组变量所抽取的主成分的相关系数描述两组变量整体的相关关系。

在具体分析过程中,尽管两组变量之间的关系是双向的,人们通常把两组变量分别称为预测变量组(predictor variables set)和效标变量组(criterion variables set),所包含的变量也相应被称为预测变量(predictor variable)和效标变量(criterion variable)。从两组变量中抽取产生的主成分之间的相关就是典型相关,主成分也相应被称为典型变量(canonical variates),它们之间的简单相关系数为典型相关系数(canonical correlations)。第一对典型相关的相关程度最高,随后的典型相关系数依次变小。典型相关分析产生的典型相关的对数(pairs)与两组中较少的变量数相一致。具体说来,典型相关分析可以实现三个层次的分析[12](见图1):

(1)探讨各对典型变量是否显著相关,如典型变量P1与C1,P2与C2;

(2)探讨每个原始变量与他们相对应的典型变量之间的相关程度,如原始变量X1、X2、X3与典型变量 P1,原始变量 Y1、Y2与典型变量 C1,等等;

(3)探讨各典型变量对两个原始变量组整体的变异解释程度,如典型变量P1对原始变量组P的变异解释,以及对原始变量组C的变异解释,等等。

图1 变量组P与变量组C的典型相关分析

三、典型相关分析的SPSS统计软件操作

典型相关分析可以通过SPSS、STATA和SAS等统计软件实现,本文仅介绍常用的SPSS统计软件操作。在SPSS中,有两种方法可进行典型相关分析,第一种是采用MANOVA分析,第二种是使用专门的典型相关分析宏程序。这两种方法都是运行简单的命令来完成分析。两种命令程序分别如下(前面是MANOVA分析,后面是CANCORR宏程序):

在输入命令语句的过程中要注意几点。关于MANOVA分析,效标变量(Y1和 Y2)应置于WITH之前,而预测变量(X1,X2和X3)则紧跟其后。在CANCORR宏程序里,INCLUDE命令用于读入典型相关的宏程序,宏程序所处的位置可能随着SPSS的安装目录变化而有所不同。此外,INCLUDE和CANCORR两个命令均应以实句点(.)结束。输入上述程序后,选择菜单Run→all运行程序,即可获得典型相关分析的统计结果。

两种方法分析所输出的结果指标略有不同,本文只列举CANCORR宏程序分析的结果。运行宏程序后,输出的结果指标包括:

①第一组(预测变量组)组内变量之间的相关系数;②第二组(效标变量组)组内变量之间的相关系数;③第一组和第二组变量之间的相关系数;④典型变量之间的相关系数;⑤ 典型相关系数显著性检验;⑥ 第一组的标准化典型相关系数(Standardized Canonical Coefficients);⑦ 第一组的原始典型系数(Raw Canonical Coefficients);⑧ 第二组的标准化典型相关系数(Standardized Canonical Coefficients);⑨第二组的原始典型系数(Raw Canonical Coefficients);⑩第一组的典型负载系数(Canonical loadings);⑪ 第一组的交叉负载系数(Cross loadings);⑫ 第二组的典型负载系数(Canonical loadings);⑬ 第二组的交叉负载系数(Cross loadings);⑭ 第一组各典型变量对第一原始变量组的变异解释程度;⑮ 第一组各典型变量对第二原始变量组的变异解释程度;⑯ 第二组各典型变量对第二原始变量组的变异解释程度;⑰第二组各典型变量对第一原始变量组的变异解释程度。

在上述的结果中,④、⑤、⑥、⑦、⑧和⑨属于第一层次的典型变量之间相关情况分析;⑩、⑪、⑫和⑬属于第二层次的原始变量与典型变量相关程度分析;⑭、⑮、⑯和⑰属于第三层次的典型变量对原始变量组的变异解释程度分析。另外,上述中有三个术语常见于典型相关分析:一是“标准化典型系数”,反映原始变量在典型变量中所占典型权重的大小;二是“典型负载系数”,是指原始变量与典型变量之间的简单相关系数,反映原始变量与典型变量的共同方差;三是“交叉负载系数”,是指一个组中的原始变量与另一组中的典型变量之间的简单相关关系,反映一组的原始变量与另一组典型变量的共同方差。

四、典型相关分析的具体应用:以高一虹等的研究为例

以典型相关分析为关键词在中国期刊网查询,结果发现目前国内应用典型相关分析开展外语教育实证研究仅有三例[10,13,14]。本文以高一虹等(2002)的《大学本科生英语学习动机类型与自我认同变化的关系》为例解析典型相关分析在外语教育研究领域的实际应用[13]。在这项研究中,动机类型包括7个维度(变量):内在兴趣、成绩动机、情景动机、出国动机、社会责任动机、个人发展和信息媒介动机。自我认同变化类型则包含了6个维度(变量):自信心变化、削减性变化、生产性变化、附加性变化、分裂性变化和零变化。如果要把握动机类型与自我认同类型的整体关系,或者要弄清哪些动机类型与哪些自我认同类型相关最大化,正如Cooley和Lohnes(1971)一书所指出的,简单相关分析和多元回归分析难于胜任,而典型相关分析使得回答这样的问题成为可能[11]。

通过典型相关分析所获得的结果可以粗略分为三大部分,即典型相关的三个层次分析:一是典型相关系数及显著性检验,典型相关系数反映典型变量之间的相关程度;二是标准化典型系数和典型负载系数,它们反映原始变量(观测变量)对典型变量的解释力;三是典型冗余分析,冗余系数反映典型变量对原始变量组的贡献力。

1.典型相关系数及显著性检验

这项研究一共抽取了6对典型相关(动机类型的典型变量由X1到X6表示,自我变化的典型变量由Y1到Y6表示),随后的显著性检验表明,只有前4对典型变量显著相关(P=0.000),见表1。英语学习动机与自我认同变化的关系主要反映在这4对典型相关关系上,因而它们是主要考察分析的对象。4对典型相关系数依次为:0.681(X1 - Y1),0.367(X2 - Y2),0.317(X3 - Y3),0.232(X4-Y4)。

表1 典型相关系数及显著性

2.标准化典型系数和典型负载系数

这部分主要反映了原始变量和典型变量之间的关系,即权重和相关程度(见表2)。典型负载系数反映原始观测变量对典型变量的总影响,而标准化典型系数则反映原始观测对典型变量的直接影响,即扣除与其它变量的共同作用后,原始变量对典型变量的影响。在第一对典型相关(X1-Y1)中,典型变量X1主要代表的观测变量是内在兴趣(典型负载系数(简称CL)为0.86,标准化典型系数(简称SC)为0.674),而典型变量Y1主要代表的观测变量是生产性变化(CL为0.883,SC为0.577)。在第二对典型相关(X2-Y2)中,典型变量X2主要代表个人发展动机(CL为0.846,SC为0.897),典型变量Y2主要代表的原始观测变量则是自信心变化(CL为 -0.784,SC为 -0.997)。

在第三对典型相关(X3-Y3)中,典型变量X3主要代表的原始观测变量包括成绩动机(CL为 -0.565,SC为 -0.429)、情景动机(CL为-0.61,SC为-0.52)和出国动机(CL为0.593,SC为0.601),典型变量Y3主要代表的观测变量包含削减性变化(CL为-0.718,SC为-0.530)和分裂性变化(CL为 -0.748,SC为 -0.483)。在第四对典型相关(X4-Y4)中,典型变量X4主要代表的观测变量是社会责任动机(CL为0.755,SC为0.834),典型变量Y4主要代表的观测变量是分裂性变化(CL为0.459,SC为0.683)和生产性变化(CL为0.409,SC为0.836)。

根据上述分析,可进一步构建典型相关分析路径模型[13],见图2。在图2中,每个典型变量根据自身的特点赋予了相应的名称,以便分析和理解。典型相关模型清晰地展现了大学生英语学习动机与自我认同变化的内在关系,尤其是哪些学习动机类型与哪些自我认同类型密切关联,例如内在兴趣动机越强的学生在生产性、附加性自我认同方面的变化就越大,个人发展动机主要对学生的自信产生影响,等等。

表2 标准化典型系数和典型负载系数

图2 英语学习动机与自我认同变化的典型相关分析路径模型

3.典型冗余分析

冗余分析反映典型变量对原始变量组整体的变异解释程度,即典型相关的第三层次分析,分为组内变异解释和组间变异解释。由表3可见,来自动机类型的典型变量X1、X2、X3、X4分别可以解释动机变量组的31.95%、13.91%、21.58%和9.41%,4个典型变量累积可以解释动机变量组的76.85%。同时,这4个典型变量分别还可以解释自我认同变化变量组的14.81%、1.88%、2.17%和0.508%,累积解释为19.36%。同样,来自自我认同变化的典型变量Y1、Y2、Y3、Y4分别可以解释自我认同变量组的22.33%、13.59%、15.75%和12.69%,累积解释达64.37%,还可以分别解释动机类型变量组的10.35%、1.83%、1.58%和0.69%,累积解释为14.45%。通过冗余分析可以看出典型变量对原始变量组的整体影响,而其解释程度则说明还存在没有纳入分析但发生作用的一些其它因素。

表3 典型冗余分析

显而易见,上述的典型相关分析使得涉及13个变量的英语学习动机类型与自我认同变化的深层关系和整体图景变得清晰,易于把握,最终得出两个重要的研究发现:内在兴趣动机与生产性、附加性变化联系密切;个人发展动机与自信变化相关联。

五、结语

从以上有关典型相关分析的介绍和实例剖析,可以得出:(1)作为研究两组变量相关关系的多元分析方法,典型相关分析容许包含多个预测变量和多个效标变量;(2)在处理两组变量的相关性时,典型相关分析明显优于简单相关分析、多元回归分析和因素分析;(3)由于外语学习过程的多因素特征,典型相关分析在外语教育研究领域具有良好的应用前景;(4)典型相关分析的SPSS统计软件操作简单易学,有利于外语研究者的掌握和应用。另外,有一点需要指出的是,典型相关分析的实质是探索性的,这就限定它的适用范围,主要用于揭示多个变量之间的关系。因此,在发现了变量之间的基本关系,同时有了比较完善的理论框架之后,应该考虑换用更加精确的统计分析工具,如具有理论模型验证性质的结构方程模型等。

[1]桂诗春,宁春岩.语言学研究方法[J].外语教学与研究,1997(3):14-20.

[2]高一虹,李莉春,吕珺.中、西应用语言学研究方法发展趋势[J].外语教学与研究,1999(2):8-16.

[3]王静.中国大学英语教学研究近况及展望[J].语文学刊:外语教育与教学,2009(11):91-92.

[4]吴旭东,张文忠.我国外语教学实验研究质量调查[J].外语教学与研究,2001(1):86 -97.

[5]杨军.关于我国外语教学研究中统计分析运用的讨论[J].四川外语学院学报,2005(1):133-138.

[6]张少林.科学形式下的“不科学”——析外语科研论文中虚构统计推断结果现象[J].国外外语教学,2004(4):48-54.

[7]Hotelling U.Relations between two sets of variables[J].Biometrika,1936(28):321 -377.

[8]文秋芳,王立非.二语习得研究方法35年:回顾与思考[J].外国语,2004(4):18-25.

[9]Hyeonokh Kim-Yoon.Learner beliefs about language learning,motivation and their relationship:A study of EFL learners in Korea[D].Texas:The University of Texas at Austin,2000:49 -153.

[10]肖德法,袁凤识.学习策略与课堂行为关系的典型相关研究[J].四川外语学院学报,2007(3):130-132.

[11]Cooley W W,Lohnes P R.Multivariate data analysis[M].New York:Wiley,1971.

[12]Harlow L L.The essence of multivariate thinking[M].London:LawrenceErlbaum Associates,2005:177-198.

[13]高一虹,赵媛,程英,等.大学本科生英语学习动机类型与自我认同变化的关系[J].国外外语教学,2002(4):18-24.

[14]李淑静,高一虹,钱岷.研究生英语学习动机类型与自我认同变化的关系[J].外国语言文学,2003(2):14-19.

Conducting and Interpreting Canonical Correlation Analysis in Foreign Language Education Research

LI Guang-ze
(School of Foreign Languages,Fujian Normal University,Fuzhou 350007,China)

This article introduces the statistic principles,SPSS operations and an applied example of Canonical Correlation Analysis(CCA).CCA is a multivariate statistical model that facilitates the study of interrelationships among multiple independent variables and multiple dependent variables.In CCA,there are three layers of analysis:(1)to explore whether pairs of canonical variates are significantly related;(2)to find out how the predictor variables relate to their respective canonical variates,and how the criterion variables relate to their respective canonical variates;and(3)to see how the variables on each side relate to the canonical variates on the other side.The article concludes by pointing out the implications and applicability of CCA for foreign language education research.

Canonical Correlation Analysis;basic principles;SPSS operations;foreign language learning;

G64

A

1674-8425(2012)03-0113-07

2011-11-17

福建省教育厅社科项目(JA10108S)。

李光泽(1975—),男,福建德化人,博士,讲师,研究方向:心理语言学。

(责任编辑 魏艳君)

foreign language education research

猜你喜欢

学习动机典型外语
用最典型的事写最有特点的人
多项式求值题的典型解法
典型胰岛素瘤1例报道
大学生学习动机功利性倾向调查
如何激发学生的数学学习动机
如何激发初中学生英语学习动机
外语教育:“高大上”+“接地气”
大山教你学外语
大山教你学外语
大学生学习动机与学习成绩的相关研究