APP下载

症状自评量表(SCL-90)河南省青少年区域性常模的建立和心理测量特性验证*

2022-09-20

精神医学杂志 2022年2期
关键词:效度信度总分

症状自评量表(SCL-90)于1984年引入中国[1],广泛用于测量临床精神症状和心理健康状况[2]。在过去的30年里,SCL-90一直是中国测量主观症状方面的最常用量表,通过中国知网(CNKI)数据库检索,近10年以大学生和中学生群体为研究对象,以SCL-90作为调查工具的论文高达2 217篇。近些年SCL-90被应用于学校心理危机在线筛查系统以及政府相关部门组织的心理普测[3, 4]。

然而SCL-90的使用一直存在争议。由于引入中国时没有对其区域适用性进行系统研究,导致后续近15年相关研究的结果差异较大,可信度较差[5],信效度检验显示出信度不稳定及结构效度不佳等问题,例如,在相似群体中,樊玉贤等[6](2002)研究结果显示, SCL- 90各量表的同质性信度(0.52~0.76)低于陈树林等[7](2003)(0. 70~0.88)。谢华等[5](2006)研究发现十五因子模型用于大学生群体;Yu Y等[8]发现传统九因子模型适用于17~25岁的人群,但其区分效度欠佳。因此需要针对不同群体对SCL-90进行信效度再验证,保证其生态效度[9]。

心理量表的常模与被试心理属性的差异是影响测量结果和研究推论的关键因素,包括时间、地域和文化差异等。有学者提醒研究人员在使用SCL-90进行心理健康评估时应更多地考虑所适用的范围和属性[10]。从上世纪80年代中国改革开放以来社会发生重大变化,新冠疫情爆发前的多个研究也印证了不同时期青少年群体全国常模的变化[8],同时,一些研究对SCL-90的区域常模也进行了分析和更新[11],这些研究结果表明不同地域和不同文化下青年群体心理健康水平差别较大,应考虑区域文化土壤根植出的心理特征和价值观念体系与心理健康水平的相关性。近两年受全球新冠疫情影响,中国从重大公共卫生应急状态逐渐过渡至常态化防控状态,各群体心理展现出新的特点,因此有必要验证SCL-90的适用性并为区域性常模的建立提供实证支持。

1 对象与方法

1.1 对象 通过整群抽样,对来自河南省东部、西部和省会城市共10所学校(含综合型高校、高中和职业中专)和两个聚集产业园区的15~29岁样本进行测试。有效样本59 244份,其中男32 857名,女26 387名;年龄15~19岁共有22 442名,20~24岁共有19 229名,25~29岁共有17 573名;高等教育在学的共有13 718名,高中在学的共有17 357名,已经就业的共有28 169名。样本代表性判断以《河南省统计年鉴2021》报告数据为参照标准。截止2020年底,河南省15~29岁人口女性占比43.6%;15~19岁人口数量556万,20~24岁人口数量487万,25~29岁人口数量547万;高等教育阶段在学人数(含研究生)、高中阶段在学人数(含职业中专)和就业人口的比例约为1∶1.16∶2.8。

1.2 方法

1.2.1 研究工具 本研究采用中文版SCL-90[1],此量表包括躯体化(SOM)、强迫(OC)、人际敏感(IS)、抑郁(DEP)、焦虑(ANX)、敌对(HOS)、恐惧(PHOB)、偏执(PAR)、精神病性(PSY)等因子,采用5级评分(1分“从来没有”至5分“很重”)。所有被试都收到了有关调查目的的详尽信息。在测量开始之前,每个被试都会签署一份电子同意书。

2 结果

2.1 SCL-90的心理测量学特性 当Cronbach’s α超过0.70[12]并且组内相关系数(ICC)大于0.75时,通常被认为具有良好的信度[13]。结果表明,SCL-90总分及各因子分均显示出较高的内部一致性信度和组内相关系数。见表1。SCL-90总分及各因子分的相关性在0.42~0.73之间(P<0.01),平均值为0.58。这些项目-总相关性都超过了0.3的临界值[14],表明项目效度是可以接受的。验证性因子分析评估了模型拟合比较拟合指数 (CFI)、Tucker-Lewis 指数 (TLI)、标准化均方根残差 (SRMR) 和近似均方根误差 (RMSEA)。卡方值χ2对超过250的样本量过于敏感,因此未被考虑[15]。SCL-90的九因子结构与数据的拟合度非常好,CFI = 0.999,RMSEA = 0.022,TLI =0.998,SRMR =0.0035,同时,各因子的项目载荷较好。见表2。九个因子和总分之间的相关性均大于0.75。所有九个因子的综合信度均高于0.7(见表3)。所有平均方差提取值(Average Variance Extracted,AVE)都在0.35~0.44之间,表明聚合效度是可以接受的[16]。然而,如表3所示,对角线上的平均方差提取值的平方根小于非对角线相关系数值,表明各维度间的区分效度不足。

表1 SCL-90总分及各因子 Cronbach’s α 、分半信度和组内相关系数(ICC)

表2 SCL-90的聚合效度和各项目的因子载荷

续表2

表3 SCL-90的区分效度

2.2 与全国常模同年龄组比较 使用当前常模与之前公布的青年群体常模进行比较,用于比较的数据来自3项先前发表的研究:(1)金华等[17]1986年公布的全国常模;(2)Yu Y等[8]2014年更新的常模(报告发表于2020年);(3)Tian F等[18]于2020年1月31日~2月2日新冠疫情爆发初期报告的常模。不同样本数据集的各因子得分趋势基本一致,由图1可以初步判断,本研究常模与Yu Y等[8]2014年的全国常模更为接近。但从贝叶斯检验来看,与Yu Y等[8]的结果相比,本研究在所有维度的贝叶斯因子BF10均大于100(见表4),表明在这些分量表的得分上,本研究小于Yu Y等[8]的可能性比相等的可能性高100倍以上。

图1 常模的变化趋势与纵向比较

表4 当前常模与2014年常模的贝叶斯检验

男性和女性SCL-90偏执和精神病性因子分比较差异无统计学意义(BF01> 10.70),其余的所有后验中位数(posterior medians)均为负数,表明男性的平均分低于女性。所有贝叶斯因子BF10均大于100,除了躯体化因子BF10为13.18。贝叶斯分析结果还支持年龄主效应显著,除了精神病性因子(BF01= 23.74)和偏执因子(BF01= 4 318.32)外。结果显示,除了偏执因子(BF01= 12.54),不同身份状态的各常模比较差异均有统计学意义。见表5。

2.3 使用不同临界值的检出率分析 以均分加1个标准差为临界值计算检出率,并与以2点作为临界值的检出率进行比较,发现除了焦虑、敌对和偏执外,所有因素差异均有统计学意义(BF10>1 000)。以均分作为临界值,检出率在13.12%和15.19%之间,相对集中。但是以2分为临界值,强迫达到了30.36%,躯体化为8.3%,而以3分为临界值的阳性检出率不超过4.4%,最低的躯体化症状检出率仅为1%。见表6。

表5 常模人口学变量的贝叶斯检验

表6 不同临界值检出率比较[n(%)]

3 讨论

SCL-90最初是基于标准参考的测量,而不是基于常模参考,如果抽取的常模指标与测试需求不符,很难客观地对测试者的属性进行科学测量,因此是否适合将其转化为常模参考来评估普通人群的心理健康状况一直都存在争议。本研究从大量、相对具有代表性的区域性样本中获得数据,验证其16~29岁人群心理健康评估中的信度和效度,进一步阐明这一广泛使用的量表在评估心理健康方面的优势和局限性;与此同时,比较当前样本群体数据与先前报告的常模之间的差异,讨论影响分值变化的因素。

樊玉贤等[6](2002)对健康中学生进行抽样,发现条目评分与总分相关性为0.23~0.65,Cronbach’s α为0.52~0.81[6]。施玲燕等[19](2020)使用SCL-90测试并统计分析8 265名在校大学生数据,条目评分与总分相关性为0.34~0.75;总分与各因子分的相关系数为0.76~0.92。本研究样本中SCL-90总分与各因子分的相关系数范围为0.42~0.73,总分与各因子分的α系数和ICC在0.77~0.98。当一个量表包含多个子量表或维度时,使用Cronbach’s α计算总量表得分的信度是不合适的[20],本研究还计算了总分的复合信度,所有九个因子的系数均大于0.78,因此SCL-90被确定为表现出良好的信度[21]和条目效度。

SCL-90九因子结构的可重复性在过去曾引起过激烈的争论。1985年基于探索性因子分析的研究显示,SCL-90-R 的标准九因子结构在跨样本情况下是不可复制的[22];另外几项基于验证性因子分析 (CFA) 的研究在检索 SCL-90的标准九因子结构时也失败了,例如,谢华和戴海崎[5](2006)对3 470名大学新生样本结果进行探索性和验证性因素分析,结果显示15因素模型拟合数据效果最好,但同时指出,SCL-90的结构可能因群体而异。有研究者提出,未能检索到SCL-90-R的标准九因子结构可能与样本量不足有关,或与使用不适当的方法拟合数据有关,当将更充分和稳健的参数估计方法应用于足够大的样本时,SCL-90的标准九因子结构显示出可接受的拟合水平[23]。本研究结果与Yu Y等[8]的结果一致,他们的模型对九因子的拟合指数良好。虽然SCL-90各因子的收敛效度是可以接受的,但区分效度很差,较差的区分效度表明各因子之间可能存在概念重叠,建议谨慎对待并进一步阐明SCL-90各因子对河南16~29岁阶段健康人群的调查结果。

1986~2014年期间,SCL-90偏执、人际敏感、抑郁和敌对因子分有所下降。本研究的这四个分量表的分数同样低于其较早的其他研究。辛自强等[24](2020)阐述了这种随时间推移的心理健康趋势,青年群体心理健康水平总体呈现逐年上升的趋势,尤其人际敏感、抑郁和敌对等方面问题改善幅度较大。性别、年龄和不同身份状态群体在几乎所有因子中都表现出了显著差异,因此,除了总分外,本研究还显示了九个分量表的基于性别、年龄和身份状态的常模。

图1表明新冠疫情爆发初期的各维度分数升高[25]。值得注意的是,2021年7月河南省经历了特大洪涝灾害,2021年8~11月经历两次本土疫情爆发,本研究数据采集于2021年下半年,与2014年常态下的常模相近,说明被研究群体在多次应激事件条件下心理状态趋于稳定,在一定程度上表明可以在黄河文化框架内来理解河南青年群体压力下复原和成长的心理机制。另外,长期以来国内不少研究还在以2分[26]或者3分[27]的主观感受评定分数作为心理障碍的阳性诊断标准,尽管研究者在2019年再次强调了这种方法的局限性[28],近两年来的研究依旧使用这种经验判断作为筛查标准[29]。本研究也发现使用2分或者3分的临界值判断不能替代常模参照,不适应本研究被试年龄段群体的SCL-90的筛查需要,根据现实人群修订的常模数据作为衡量标准,是赋予使用SCL-90监测和筛查客观性的前提。

本研究的分数可以作为新的区域性常模被应用:首先,原始数据由横断面调查获取;其次,本研究样本量充足,样本基本符合全国第七次人口普查所报告的河南省16~29岁人口学特征,具有良好的代表性,通过常模样本的平均值和标准差可为解释个体心理健康水平,了解个体在其所属群体中所处相对位置提供更为丰富的信息;第三,本研究使用贝叶斯分析来获得比经典的零假设显著性检验(Null Hypothesis Significance Testing, NHST)更严谨的结果[30],因为在基于大样本研究中,即使很小的偏差也会产生统计学上的差异,但这种差异结果可能没有现实意义。最后需要强调的是,SCL-90只是一种鉴别被试心理症状的手段,为后续的评价和心理辅导提供依据,而不应成为最终目的,同时也建议未来应研发带有常模修正功能的心理测量系统。

猜你喜欢

效度信度总分
作为数学教育研究质量分析的信度
来华留学生对全英文授课教学服务满意度量表的信度和效度分析——以昆明医科大学为例
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
作为数学教育研究质量分析的效度
第59届IMO团体总分前十名的代表队及总分
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
一年级下册期末考试
一年级下册期末复习题
语言测试效度研究的另一视角:考试的因子结构研究