APP下载

对应分析与卡方检验在青州市小学生眼病患病资料中的联合应用

2012-05-23刘德平陈景武

中国卫生统计 2012年5期
关键词:假设检验眼病城区

罗 盛 刘德平 陈景武

对应分析(相应分析)其基本思想首先由理查森(Richardson)和库德(Kuder)在1933年提出,后来法国统计学家Jean-Paul Benzecri和日本统计学家Hayashi Chikio对该方法进行了发展〔1〕,主要用于分析二维数据阵中行因素和列因素间的关系。目前对应分析已被广泛地应用于自然科学和社会科学的各个领域,取得了可喜的成果〔2-4〕。

资料来源

本次调查对象是2010年青州市小学1~6年级在校学生。采用横断面的随机抽样调查方法,对学校按地理分布分为城区、平原丘陵地区、山区三层,以学校为抽样单位,进行分层整群抽样,对抽取学校的小学生进行调查。共调查12个学校7144人,其中城区2个学校2404人,平原丘陵7个学校2515人,山区3个学校2225人。表1是主要15种眼病患病资料:H10.4慢性结膜炎、H52.1近视(单纯性、病理性)、H53.0弱视、H53.5色觉缺陷、H13.1衣原体性沙眼、H52.0远视、H50.0内斜视、H50.1外斜视、H02.0睑内翻和倒睫、H10.2急性结膜炎、S05眼外伤、H55眼球震颤、H52.3屈光参差、Q12.0先天性白内障、Q10.0先天性上睑下垂。地区用英文字母表示。12所学校划归为3个地区,城区(cq):团结小学、职工子弟小学;农村平原(np):大王、大尹、东坝、贯店、黄楼、潘刘、阳河小学;农村山区(ns):莲花盆、邵庄、五里小学。为了解这3个地区与主要眼病间的聚集性,应用SAS 8.0对资料进行对应分析。

表1 3个地区15种主要眼病患病率(%)

结果与分析

1.特征根及累计贡献率

对表1进行对应分析发现,前两个特征根λ1、λ2累计贡献率为100%,说明前2个因子能解释原始资料的全部信息,此时用前2个因子表示的二维因子载荷图能充分表达原始资料中眼病患病率与地区两属性变量间的关系。

2.因子载荷

表1资料的行因素(地区)及列因素(眼病)的第一因子负荷(Dim1)和第二因子负荷(Dim2),列于表2。

表2 眼病患病率的因子载荷

将表2行因素及列因素的第1、第2因子负荷分别绘在同一因子图上,得因子载荷图。由图可以看出三个地区分布在三个不同的象限。H52.1近视(单纯性、病理性)、H02.0(睑内翻和倒睫)聚集性比较大,代表地区为城区(cq);H53.5色觉缺陷、H53.0弱视聚集性比较大,代表地区为农村平原(np);H13.1衣原体性沙眼、H10.4慢性结膜炎、S05眼外伤聚集性比较大,代表地区为农村山区(ns)。另外H52.3屈光参差、H10.2急性结膜炎与H50.0内斜视有一定的相关性;Q10.0先天性上睑下垂、Q12.0先天性白内障与H55眼球震颤有一定的相关性;H52.0远视与H50.0内斜视有一定的相关性。且H52.3屈光参差、H10.2急性结膜炎高发区可能是H52.0远视、H50.0内斜视的低发区。

(3)眼病患病率的假设检验

对应分析虽然可以揭示行因素和列因素间的关系,但它不能代替两个变量之间的假设检验。根据研究目的需要,可以对经对应分析显示与3个地区之间有关联性倾向的主要眼病分别进行假设检验,来进一步分析不同眼病患病率在地区间的差异是否具有统计学意义。

(1)近视眼患病率的假设检验

表3 3个地区近视眼患病情况

经卡方检验得χ2=67.448,P<0.0001,差别有统计学意义,可认为近视眼患病率在三个地区间有差异,经两两比较得城区与农村平原患病率有差异(χ2=55.922,P <0.0001),城区与农村山区有差异(χ2=39.168,P<0.0001),农村平原与农村山区间无差异(χ2=0.978,P>0.05),且城区患病率最高,为25.7%。

(2)睑内翻和倒睫患病率的假设检验

表4 3个地区睑内翻和倒睫患病情况

经卡方检验得χ2=7.187,P<0.05,差别有统计学意义,可认为睑内翻和倒睫患病率在三个地区间有差异。经两两比较得城区与农村平原患病率有差异(χ2=6.832,P=0.009),城区与农村山区无差异(χ2=2.184,P>0.05),农村平原与农村山区间无差异(χ2=1.213,P>0.05),且城区患病率最高,为1.1%。

(3)色觉缺陷患病率的假设检验

表5 3个地区色觉缺陷患病情况

经卡方检验得χ2=0.949,P>0.05,差别无统计学意义,尚不能认为色觉缺陷患病率在三个地区间有差异。

(4)弱视患病率的假设检验

表6 3个地区弱视患病情况

经卡方检验得 χ2=2.658,P>0.05,差别无统计学意义,尚不能认为弱视患病率在三个地区间有差异。

(5)衣原体性沙眼患病率的假设检验

表7 3个地区衣原体性沙眼患病情况

经卡方检验得 χ2=1.976,P>0.05,差别无统计学意义,尚不能认为衣原体性沙眼患病率在三个地区间有差异。

(6)慢性结膜炎患病率的假设检验

表8 3个地区慢性结膜炎患病情况

经卡方检验得 χ2=0.896,P>0.05,差别无统计学意义,尚不能认为慢性结膜炎患病率在三个地区间有差异。

(7)眼外伤患病率的假设检验

表9 3个地区眼外伤患病情况

经确切概率法得,P>0.05,差别无统计学意义,尚不能认为眼外伤患病率在三个地区间有差异。

讨 论

对应分析可以直观地表现多项分类列联表资料中行因素和列因素间的对应情况,通过因子载荷图使行因素和列因素间关系得以直观的展示,从量上发现有聚集性倾向的眼病和主要眼病对应的高发区。但是这种直观的有关联性仅仅说明了一种倾向或趋势,为进一步研究指出了方向,并无具体的计量标志,也不能代表有统计学意义,根据研究目的,我们可以在对应分析的基础上结合有关假设检验来进一步分析,以检验不同地区和对应眼病间的聚集性有无统计学意义,从而可以确定不同眼病的高发地和低发地及不同眼病的相关性。同时,在方法学上把无具体的计量标志的对应分析方法进一步扩展,得出更精确的“量化”结论。

本研究运用对应分析对山东省青州市3个地区小学生眼病患病率资料进行分析,由因子负荷图可以直观地看出城区、农村平原和农村山区与眼病的对应关系以及不同眼病的聚集性,然后运用卡方检验分别对与3个地区间有关联性倾向的眼病患病率进行假设检验以确定聚集性有无统计学意义。经卡方检验得出近视眼患病率(H52.1)、睑内翻和倒睫患病率(H02.0)与城区的聚集性有统计学意义,说明城区是这两种眼病的高发地,从而我们可以提出针对性的防治措施,为降低本地区小学生近视眼和睑内翻和倒睫发病率提供科学的依据。

1.何晓群.多元统计分析.中国人民大学出社,2004:195-219.

2.Alain F.Canonical correspondence analysis of lowland pasture vegetation in the humid tropics of Mexico .Statistics for Biology and Health,2007:561-547.

3.Mao DQ.Correspondence analysis on images of Jiangxi Province as a tourist destination.Chinese Geographical Science,2005,15(3):275-280.

4.Ken R.The use of correspondence analysis to develop a scale to measure workplace morale from multi-level data.Social Indicators Research,2002,3:339-351.

猜你喜欢

假设检验眼病城区
长沙市望城区金地三千府幼儿园
假设检验结果的对立性分析
《中国眼健康白皮书》:九成大学生是近视眼
金霞早油蟠在保定满城区的表现及栽培技术
2799例新生儿眼病筛查结果分析
统计推断的研究
福田要建健康城区
凤爪重量质量管理报告
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
对淮安市城区河道生态建设的思考