创造力成就问卷的中文修订 *

2020-07-20王战旗张兴利

心理与行为研究 2020年3期

王战旗张兴利

(1 中国科学院行为科学重点实验室（中国科学院心理研究所），北京 100101)(2 中国科学院大学心理学系，北京 100049) (3 课程教材研究所，北京 100081)

1 引言

创造力是研究个体创造出在一定社会情境中新颖、有用的产品以及在该过程中个体表现出的态度、涉及的心理过程以及个体与环境之间的交互作用（施建农, 2015; Plucker & Beghetto, 2004）。该定义清晰地指出了创造力领域的四个主要研究对象：人、过程、环境和产品（Rhodes, 1961）。对人的研究主要关注的是哪些个体特征与创造力相关（如人格、思维风格等）。创造过程则从创造发生的一般心理过程（如认知结构的灵活性、工作记忆容量、注意系统等）的角度研究创造力的发生机制。创造的发生离不开特定的环境—因为创造性产品是否适宜，往往是由他人（如社会或某领域的专家群体）来判断的，而这些“他人”的判断标准实际上就是历史文化及该领域以往知识积累的产物。创造力又体现为一定的产品；当强调产品的社会文化属性时（即其被社会或特定领域的认可情况），则称之为创造力成就（Karwowski, Kaufman, Lebuda, Szumski, &Firkowska-Mankiewicz, 2017; Sawyer, 2012）。目前对创造力的测量和评价也多是从这些角度进行的。

创造力测量是创造力研究的基础，然而该领域的研究成果却经常受到质疑，因此如何准确测量创造力是亟需解决的问题（贡喆, 刘昌, 沈汪兵,2016）。20世纪50年代以前，心理学家一般认为高创造力是高智力的副产品，因此对创造力的研究以研究智力为主要手段，并且以研究高创造力的人才为主（Sawyer, 2012）。比如Terman的追踪研究（Terman, 1926; Terman & Oden, 1959）就是用智力测验筛选出一批学生，然后长期追踪研究其智力与成就的关系。这一时期对创造力成就的测量方式也很粗糙，一般直接以社会认可度（比如是否被列入辞典）作为判断依据。自从Guilford（1950）呼吁学界关注创造力研究后，创造力研究进入蓬勃发展阶段，研究者开始从上述的个体特征、思维过程、环境以及产品的角度对创造力进行深入的测量与研究。在这些研究角度中，人格研究与创造力研究因为都关注个体思维与行为的独特性，所以对二者的关系进行研究很自然就成为一个重要的研究视角（O'Rourke, Kaufman, Feist, &Reiter-Palmon, 2017）。这方面的研究早期多从人格特质（personality traits）角度进行，如，加州大学伯克利分校的人格测量与研究学院的研究者用访谈法对多个领域的杰出代表进行研究，发现某些共同的个体特征。后来的研究更多地集中于人格类型方面（personality types），即用有限的人格类别对个体进行分类，这一类研究早期的代表是基于荣格的心理类型理论编制的迈尔斯-布里格斯类型指标（Myers-Briggs Type Indicator，MBTI）（Quenk, 2009）。目前人格类型视角的研究最常见的研究工具是大五人格量表（Sawyer, 2012）。用大五人格量表进行的人格与创造力关系的研究目前较为一致的结论是：经验开放性是五因素人格模型中与创造力具有跨领域相关的人格因素；开放性、严谨性与创造力的相关存在领域差异，且相关度较低（Feist, 2018）。

除了人格研究视角外，早期的研究还认为以发散性思维（divergent thinking，DT）为主的创造性思维是代表个体创造力的优良指标，并基于此观点编制了大量测验。在众多测量创造性思维的工具中，托伦斯创造性思维测验（Torrance Tests of Creative Thinking，TTCT）是使用最广泛的工具之一。但是随着研究的深入，人们开始质疑用发散性思维作为测量创造力指标的合理性。有学者认为发散性思维并不是一种通用的创造性思维技能，而是具有一定领域性的技能（Anastasi, 1982;Brown, 1989; Crockenberg, 1972）。还有研究发现个体在不同创造力领域的表现相关性并不显著（Baer,1991; Runco, 1989）。在此背景下，Baer（1998）提出了创造力领域特殊性的观点，并认为在领域一般性和特殊性之争没有解决之前，采取领域特殊性的观点是比较保险的策略。但是持领域一般性观点的研究者则认为很多支持领域特殊性观点的研究在概念、方法和逻辑等方面存在问题（Plucker, 1998）。Sternberg（2005）以内容的心理表征与心理过程的区别为例指出，真实的世界更加复杂，以领域一般性和领域特殊性的二元观点来看待创造力并不能很好地解释创造力的复杂性。随着研究的深入，研究者开始认识到创造力既存在领域一般性成分，也存在领域特殊性成分（Baer & Kaufman, 2005; Plucker & Beghetto,2004）。例如，Baer和Kaufman形象地以在游乐场游玩的过程为例说明创造力需要从一般到特殊逐步递进的知识和技能。

由于早期的创造力测量都是默认基于领域一般性的观点编制的，因此能够体现领域特殊性的创造力测量工具很少。近十几年来基于创造力领域特殊性理论编制的创造力问卷主要有Carson，Peterson和Higgins（2005）的创造力成就问卷（Creative Achievement Questionnaire，CAQ）以及Kaufman（2012）的创造力领域量表（Kaufman Domains of Creativity Scale，K-DOCS）。Carson 等（2005）编制的CAQ问卷是一套简单、易实施且相对客观的自我报告式问卷，对视觉艺术、音乐、舞蹈、科学探究等10个领域的创造力成就进行测量。与以前杰出创造力研究中测量指标极其单一的情形不同，该问卷选择了10个常见的创造力领域，每个领域设定8个由低到高的具体指标，指标数量和层次更加丰富。与专家评价法相比，该问卷施测和评分更方便、快捷。另外，以往的自我报告式问卷的问题往往比较含糊，容易引起不同的理解，而CAQ问卷的题目更加具体、客观，能较好地避免社会赞许性带来的测量偏差（Silvia, Wigert, Reiter-Palmon, & Kaufman, 2012）。涂翠平和樊富珉（2015）曾修订了K-DOCS量表，不过该量表测量的仅是5个领域，而Carson等的CAQ问卷包含的领域更多，更有利于对创造力的领域性特征进行研究。另外，CAQ问卷测量专业创造力，而K-DOCS量表测量日常创造力（Silvia et al., 2012）。CAQ问卷自编制出来以后，使用非常广泛，但尚未在国内引起关注，也未见修订。因此本研究基于中国成人群体对其进行修订，并对其信度和效度进行检验。

2 方法与程序

2.1 CAQ原版问卷简介

2.1.1 编制情况及适用对象

Carson等（2005）选择了视觉艺术、音乐、舞蹈、建筑设计、创造性写作、幽默、发明、科学探究、舞台影视表演这9个普遍认为需要较高创造力的职业，并加上了烹饪这一职业；在征求各行业专家的意见后，每个职业按照从低到高选出8种常见的创造力成就形式，并按照此顺序列出。被试根据自己在各个领域的各个条目上的表现依次进行勾选。问卷的编制者在美国大学生和研究生群体中对该问卷的信效度进行了检验。

2.1.2 问卷结构、施测及计分方式

CAQ问卷包括三部分。第一部分列出了视觉艺术（绘画和雕塑）、音乐、舞蹈、个人运动（网球和高尔夫）、团体运动、建筑设计、创业、创造性写作、幽默、发明、科学探究、舞台影视表演、烹饪共13个领域，要求被试勾选自认为比一般人具有更多天资、能力或者受过更多训练的领域，可以多选。第二部分包括了其中的视觉艺术（绘画和雕塑）、音乐、舞蹈、建筑设计、创造性写作、幽默、发明、科学探究、舞台影视表演、烹饪10个领域，每个领域列出8个等级的创造力成就的陈述句，要求被试勾选与自己情况相符的条目。每个领域第一个选项都是“我在本领域没有接受过训练或者被认可的才能”或相近的表述，其余的选项按照成就从低到高的顺序列出。对于每个领域的最高成就，序号前以星号标记，如果被试勾选了该选项，则同时要填写该情况发生的次数。问卷编制者还对不同领域之间同等级条目的等值性进行了调校，使其尽量具有等值性。第三部分列出3个与个人创造性特征有关的陈述句，被试可根据自己的实际情况勾选。在实际应用中，研究者可以在此部分根据自己的研究兴趣添加其他问题。

在计分时，仅统计第二部分的10个领域的题目。每个领域的第一个选项分值为0，后边7个选项分值依次为1到7。对于带星号的选项，其实际分数为该题目的基础分值乘以该情况发生的次数。每个领域的得分为所有被勾选项得分的总和。10个领域的得分相加，为问卷的总分。以下是第二部分“发明”领域的8个条目：1. 在这方面我没有公认的才能。2. 我经常能发现家庭日常用品的新用途。3. 我曾经设计过一个发明并对其进行了改进。4. 我曾经编写过电脑软件。5. 我曾经给自己设计的发明做出过一个原型。/ 我的发明在一个普通比赛中获过奖。6. 我曾经把我的一个发明卖给我认识的人。/ 我的发明在地区专业比赛中获过奖。*7. 我的一项发明获得过专利证书。/ 我的发明在省级专业比赛中获过奖。*8. 我曾经把自己的一项发明卖给一家公司。/ 我的发明在全国（或国际）专业比赛中获过奖。

2.1.3 问卷的信度与效度

问卷的原英文版有较好的信效度（Carson et al.,2005），其重测信度为 0.81（p＜0.001）。在效标效度方面，以拼贴画测验的专家评分为效标，相关系数为0.59（p＜0.001）。在聚合效度方面，与创造性人格量表相关系数r=0.33（p＜0.01），与大五人格的经验开放性维度相关系数r=0.33（p＜0.01），与发散思维测验（用TTCT测验的非常规用途任务和结果想象任务测量）三个指标的相关系数为：流畅性r=0.38（p＜0.001），灵活性r=0.37（p＜0.001），独创性 r=0.46（p＜0.001）。与韦氏智力测验分数的相关系数为r=0.14（p=0.06），显示该问卷与智力有较好的区分效度。

2.2 中文版修订工作的程序

2.2.1 翻译与回译

对问卷修订前，研究者联系了Carson教授并得到了进行中文版修订的许可。问卷的修订经过了翻译、回译和文化调适的过程。在翻译环节，由两个分别具有4年和19年工作经验的英文编辑对原问卷进行了独立翻译，然后核对两人翻译的差异之处并进行改进，形成中文初稿。由一位中文流利且具有心理学背景的英国学者把中文初稿翻译为英文。然后对回译稿和问卷原稿进行对比，根据译文的差异情况对中文翻译内容进行调整。

2.2.2 文化调适

在这个环节，分别请一位书法特级教师兼培训师、两位美术专业编审、一位音乐专业编审、一位音乐专业编辑、一位专业舞蹈教师、一位建筑设计工程师、一位建筑建造师、一位原创文学公众号的创办者、一位理科副编审、一位纪录片导演、三位有职业资质的厨师分别对各自熟悉领域的问卷条目进行评估，提出意见和改进建议。最终对问卷中文版初稿做出了如下主要调整：（1）“视觉艺术（绘画和雕塑）”领域增加了“书法”项，“个人运动（网球和高尔夫）”调整为“个人运动（棋类、乒乓球、羽毛球等）”；（2）各个领域最后3项成就分别增加在地区、省级和国家级比赛或评比中获奖的条目（个人成就情况符合该项中任何一种情形都算是符合该项），并根据不同领域的具体情况对陈述方式进行调整；（3）对于第三部分第三个问题中的“心不在焉的教授”（absent-minded professor），意译为中国人更容易理解的说法：“在自己擅长的领域很厉害，但是在其他方面还不如普通人”。

2.2.3 被试、程序及研究工具的性能

本研究的被试是从在北京某大学参加研修班学习且已经参加工作的成人中抽取的，有效被试信息见表1。被试都被告知了研究的基本情况。

虽然CAQ问卷各领域内的条目测量的都是该领域的创造力成就，但是由于领域内各条目间创造力成就为递增关系，因此该问卷无法进行内部一致性或同质性检验（Silvia et al., 2012），因此本研究在信度方面采用重测信度检验。具体过程为：抽取被试68名，发放问卷，被试作答后全部收回。三周后对该批被试进行重测。因9个被试流失，有效问卷59份（样本1）。为检验问卷的聚合效度和区分效度，抽取被试116名，施测CAQ问卷中文修订版、中国大五人格简式版（王孟成, 戴晓阳, 姚树桥, 2011）和托伦斯创造性思维测验的非常规用途任务和补全图画任务；剔除信息不完整问卷后，得到有效问卷107份（样本2）。另外，对样本2中60名被试施测瑞文标准推理测验，以检验CAQ问卷中文修订版和智力的区分效度。为检测问卷的构想效度，抽取被试357名进行施测，收回342份，剔除信息不完整的问卷后，得到有效问卷324份（样本3）。为检测问卷的效标效度，对123名被试施测了CAQ问卷中文修订版、涂翠平和樊富珉（2015）引进并修订的K-DOCS创造力量表（Kaufman，2012），去掉作答不规范的问卷1份，得到有效问卷122份（样本4）。

表1 有效被试基本信息

本研究中，两个评分者对TTCT测验的2个任务的8个指标分别进行打分，评分者一致性信度为0.88～0.98，中国大五人格简式版五个维度的内部一致性系数为0.74～0.88，K-DOCS五个领域的内部一致性信度为0.85～0.90。

2.2.4 统计分析工具

研究中对获得的数据使用SPSS 25.0进行描述统计、相关系数的计算和因子分析等。因为创造力问卷的计分特点会造成问卷分数呈偏态分布，所以凡是与创造力成就分数有关的相关系数，均为斯皮尔曼相关系数。

3 检验结果

3.1 重测信度

结果如表2所示，CAQ中文修订版10个领域在3周后的重测信度在0.64～0.86之间，总重测信度为0.77，重测信度较好。

表2 CAQ中文修订版各领域及总分的重测信度（n=59）

3.2 效度

3.2.1 聚合效度

本研究分别用TTCT的言语分测验中常用的非常规用途任务和图形分测验中的补全图画任务检验CAQ问卷中文修订版的聚合效度。统计结果如表3所示，非常规用途任务各指标得分与CAQ问卷中文修订版得分的斯皮尔曼相关系数在0.19～0.26之间；补全图画任务各指标得分与CAQ问卷中文修订版得分的斯皮尔曼相关系数中，除了与精致性相关为0.24且有统计学意义外，其他指标相关均不显著。

表3 TTCT测验两个任务与CAQ中文修订版得分的相关性（n=107）

本研究用中国大五人格简式版来检验CAQ问卷中文修订版的聚合效度。结果如表4所示，二者的相关系数为0.29（p＜0.01）。另外严谨性与创造力成就的相关为0.18（p=0.03），具有统计学意义。

表4 中国大五人格简式版各维度与CAQ中文修订版分数的相关性（n=107）

3.2.2 区分效度

对样本2中的60名被试施测了瑞文标准推理测验（有效被试数59名）。统计结果显示，CAQ问卷中文修订版得分与瑞文标准推理智力分数的斯皮尔曼相关系数为0.20（p=0.12），无统计学意义。这说明CAQ问卷中文修订版和瑞文推理测验测量的智力区分效度良好。

3.2.3 构想效度

Silvia等（2012）认为对CAQ问卷的10个领域进行因子分析的结果体现的是各领域所涉及的技能的相关性，因此可以通过因子提取情况检验哪些领域存在更多的共同技能。CAQ问卷是基于领域特殊性观点编制的，因此本研究对样本3的10个领域进行了因子分析。

统计结果显示，巴特利特球形度检验显著性p＜0.001，KMO统计检验量为0.53。在根据特征值自动提取因子的情况下，设定0.35的绝对值为排除阈限，用主成分分析法经过最大方差法旋转后得到4个类别（成分矩阵见表5）；4个类别共解释了方差的58.3%。强制提取固定数目的因子时，提取三因子模型，幽默、写作、舞台影视表演和视觉艺术成为一个类别，科学探究、建筑和发明成为一个类别，舞蹈和音乐成为一个类别，烹饪无法进入模型；三个类别共解释了方差的47.4%。提取两因子模型时（成分矩阵见表6），烹饪还是无法进入模型，写作、幽默、视觉艺术、音乐、舞台影视表演和舞蹈提取为一个因子，可以解释为艺术类别，占总方差的20.3%；科学探究、建筑设计和发明提取为一个因子，可以解释为科学类别，占总方差的15.0%。虽然累计解释方差仅为35.3%，但是提取的类别是有实际意义的。本研究的两因子模型中，艺术领域包含的职业与原作者的结果基本一致。在科学领域方面，原作者的研究结果中烹饪进入了模型中的科学类别，建筑设计被排除在模型以外；本研究结果则是建筑设计进入科学类别，烹饪被排除在模型以外。

表5 自动提取因子数情况下旋转后的成分矩阵（n=324）

表6 10个领域分数提取2因子的成分矩阵（n=324）

3.2.4 效标效度

本研究用涂翠平和樊富珉（2015）修订的KDOCS创造力量表检验CAQ问卷中文修订版的效标效度。该量表的分量表3、5测量的领域合在一起相当于本研究的艺术领域，因此本研究把这两个分量表作为CAQ问卷的艺术领域的效标检测工具。另外，该问卷的分量表4测量的是科学创造力，因此本研究把该分量表作为CAQ问卷的科学领域的效标检测工具。统计结果如表7所示，KDOCS量表与CAQ问卷中文修订版的科学、艺术领域及总分的相关显著（斯皮尔曼相关系数ρ分别为0.62, 0.47和0.41）；而前者的科学领域和后者的艺术领域、前者的艺术领域和后者的科学领域相关不显著。

4 讨论

本研究翻译了CAQ问卷，对部分题目进行了文化调适，并对其在我国成人群体中的信度和效度进行了检验。Silvia等人（2012）认为，由于CAQ问卷计分方式的特殊性，该问卷并不适合检测内部一致性信度（如果计算10个创造力领域分数的内部一致性系数，实际上表示的是各个领域的共同因素对创造力成就起的作用的大小），所以本研究对问卷做了间隔三周的重测信度检验（r=0.77,p＜0.01），结果与原问卷（r=0.81,p＜0.0001）基本一致，表明修订版问卷具有较好的重测信度。

本研究用四项研究检验了CAQ中文修订版的效度。首先，采用TTCT非常规用途任务和补全图画任务以及大五人格的开放性维度来考察该问卷的聚合效度。结果发现问卷总分与TTCT两项任务的独创性、流畅性、灵活性、精致性等多项指标以及大五人格量表的开放性维度得分相关显著。这和以往研究结果一致，如K i m（2008）、Plucker（1999）和Torrance（2002）的研究都发现发散性思维测验和创造力成就存在稳定的正相关。本研究中大五人格开放性得分与创造力成就的相关系数为0.29，这也与已有研究结果一致，如Sawyer（2012）统计了多项研究后发现发散性思维和创造力分数的相关在0.30左右。以上结果一致表明，修订版问卷具有较好的聚合效度。

其次，采用瑞文智力测验考察该问卷的区分效度，结果发现创造力成就总分与瑞文智力测验分数相关不显著。这表明该问卷区别于智力测验。该结果支持了智力在创造力表现中的 “门槛效应”（threshold effect）假设：智力是杰出创造力成就的必要不充分条件；在智力低于某个门槛时，二者相关比较明显，但是当智力高于这个门槛时，二者关系不显著（Barron & Harrington, 1981;Sternberg, 2003）。需要注意的是，瑞文推理测验测量的是个体的一般智力（张厚粲, 王晓平,1989），因此本研究检测的是创造力成就和一般智力的区分效度。

然后，通过对被试在10个创造力领域分数进行因子分析，发现在不同的提取结果中，同一类别内部的不同领域之间明显需要更多的共同技能基础，很好地支持了创造力成就领域特殊性这一CAQ问卷的理论编制基础。这对过去几十年一直存在的创造力领域一般性和领域特殊性的争论提供了很好的实证数据（蔺素琴, 申超男, 段海军, 胡卫平, 2016; 张亚坤, 陈龙安, 张兴利, 施建农, 2018;Baer, 2016; Barbot, Besançon, & Lubart, 2016;Kaufman, 2009; Plucker & Beghetto, 2004）。这同时也表明，CAQ问卷对创造力的领域一般性和领域特殊性研究是一个很好的工具。

最后，以涂翠平和樊富珉（2015）修订的KDOCS量表的科学、艺术领域及总分为效标进一步检验，结果发现，CAQ问卷与K-DOCS量表的相同领域相关显著而不同领域相关不显著，即两者的科学领域和艺术领域分别相关显著（r分别为0.62和0.47），但前者的科学领域与后者的艺术领域以及前者的艺术领域与后者的科学领域相关均不显著（r分别为0.23和0.02）。该结果表明CAQ问卷的构想效度良好，而且也进一步支持了创造力具有领域特殊性的观点。

本研究与Carson等（2005）的原研究在因子分析结果方面也有不一致的地方。“建筑设计”在Carson等的原研究中被排除在模型之外，在本研究中则进入科学领域；而原研究中进入科学领域的“烹饪”在本研究中被排除在模型外。对于建筑设计在原研究中被排除在模型之外，Carson等指出可能和该职业的被试在其样本中的代表性不足有关。对于原研究中烹饪进入科学领域而在本研究中被排除在模型外，则可能和文化差异有关，还可能与被试的选择有关：即原研究以大学生和研究生为被试，本研究则以工作的成人为被试，而有些职业成就可能只有在工作阶段才更容易取得。具体还需要进一步研究进行验证。最后，本研究中女性被试比例较大，未来可以对创造力领域职业的性别差异作进一步探索。

CAQ创造力成就问卷虽然是自我报告式问卷，但都是对个体取得的具体创造力成就的报告，与主观评价式自我报告相比，能较好地避免社会赞许性带来的测量偏差。而且该问卷测查的创造力领域较多，比较适合用于进行创造力领域性特征的研究。该问卷既可以用于考察个体间的差异，如不同领域的个体的创造力成就；也可以用于考察个体内差异，如个体在不同领域取得的创造力成就的比较，以及个体在某领域创造力成就的发展变化的动态评估。