APP下载

西藏社会和谐程度评价指标的筛选

2016-10-21西藏民族大学财经学院

大陆桥视野 2016年16期
关键词:约简海选信息熵

汪 朋/西藏民族大学财经学院

西藏社会和谐程度评价指标的筛选

汪朋/西藏民族大学财经学院

根据和谐社会建设的基本内涵,从三个准则层海选和定性初选指标,进而利用信息熵约简法和相关性分析方法相结合对指标进行定量筛选;然后定性补充,建立西藏社会和谐程度的评价指标体系;最后对构建的指标体系的合理性进行判定。实证分析表明,此方法将主客观筛选方法相结合,并且用定量的标准对指标体系进行了判定,兼具专家知识和客观实际的双重信息,从而更好的反映了西藏和谐社会评价的以人文为本,全面、协调、可持续发展的原则。

西藏;社会和谐;指标筛选;信息熵

由于社会的和谐涉及到多个方面,而每个方面的情况又由多个指标来反映,这些指标之间可能存在关联,也可能彼此不相关,因此,要构建一套反映西藏社会和谐程度的指标体系,就需要对反映西藏社会和谐各个方面的指标进行筛选,确定出一套简洁高效的指标体系。现有社会评价指标体系的筛选可分为两类。 一类是根据专家经验主观确定社会评价指标体系,这类方法的弊端是指标的选择受人为影响较大,易于出现“仁者见仁,智者见智”的情况;二是客观筛选方法, 如兰国良[1]利用主成分分析法对城市可持续发展的社会经济评价指标进行了筛选,欧阳建国[2]等利用因子分析法选取中国各地区可持续发展的指标,此类方法易受选择样本数据的影响,并且完全依靠数据确定指标,容易忽略指标的实际含义。

由此,本文提出首先定性的初选指标,然后将信息熵约简法和相关性分析方法相组合,实现对指标的定量筛选,再根据和谐社会的内涵及西藏社会的特点对用定量方法得到的指标体系进行定性的补充和完善,最终建立科学的西藏和谐社会评价指标体系,并通过实证检验,确认为较为理想的结果。

一、指标筛选的基本原理与过程

(一)筛选思路

1.通过信息熵约简法删除对准则层区别能力小的指标 ,保证指标对社会评价具有高度影响。

2.通过相关性分析删除各准则层内相关系数大的指标 ,避免指标之间信息重复。

(二)指标筛选前的数据规范化

1.正(负)向指标规范化。

设xij为第j个评价对象第i个指标的隶属度;vij为第j个评价对象第i个指标的值;n为被评价对象的个数。 根据正向指标的规范化公式[3],xij为:

负向指标规范化公式只是分子为最大值减去第i个指标值。式(1)表示第j 个评价地区第i个指标值与该指标最小值的偏差相对于该指标最大值与最小值偏差的比重,比重越大标准化后值越高。

2.适中指标规范化

设 xij、vij的含义同前文,vij0为第j个评价对象第i个指标理想值,则xij为:

(三)信息熵约简法的原理

对于给定的j,xij(i=1,2,…,n) 的差异越大,则指标准则层的比较作用就越大, 也即它所包含和传输的决策信息就越多,信息熵可被用来度量这种强度的大小。

首先,设xij(i=1,2,…,n;j=1,2,…,m)为第i个准则层中的第j项指标的观测数据,根据熵值计算公式[4]:

各准则层的评估值相差越大,指标对于准则层的比较作用就越大,即指标的区分能力就越强,所以将各准则层下区分能力小的指标进行删除。 此方法是为了删除所在准则层中对评价结果影响很小的指标,以实现对指标体系的约简。

(四)相关性分析

指标的相关性是刻画指标与指标间信息重复程度大小。如果两个指标之间存在一定的相关性,这种相关性会导致被评价对象信息的重复使用, 从而降低评价的科学性和合理性。 相关系数越大,这个指标越容易被其他指标所替代。相关性分析就是剔除相关系数较大的指标,也即可以被其他指标所替代的指标。

首先,计算各个评价指标之间(xij)的相关系数rij(其计算采用指标的标准化值)。

其次,考察指标与同层内余下所有指标的相关系数,并规定一个临界值 M(0

本文选取临界值 0.9,这样可以达到用较少的指标反映指标集90%以上的信息,从而简化指标体系

将熵值约简法与相关性分析相结合的差别及特色在于:首先利用熵值约简法删除对准则层区别能力小,也即对评价结果没有显著影响的指标。然后利用相关性分析将同一准则层内相关系数大的指标剔除,保证指标信息的不重复。两者结合保证筛选出的指标不重复且对评价结果有显著影响。

二、指标体系构建合理性的判定标准

根据某些分析方法用数据方差表示指标信息含量的方法,本文提出建立指标体系构建合理性的判定标准,认为如果用30%以下的指标反映了90%以上的海选指标信息,则认为指标体系构建成功。

设S为原始指标数据的协方差矩阵;tr(S)为协方差矩阵的迹,表示协方差矩阵的主对角线上各指标方差之和;k为筛选后的指标个数;n为海选指标的个数。 则筛选后的指标对海选指标的信息贡献率g为[5]:

(5)式的含义是筛选后的k个指标的方差之和tr(S)k占海选的n个指标的方差之和tr(S)n的比值,表示k个筛选后的指标所反映的n个海选指标的信息。 此方法解决了指标体系构建合理性缺乏定量判定标准的问题。

三、实证分析

(一)西藏社会评价指标的海选和定性初选

依据文献[6~9],并结合西藏的特点及对西藏的深入调查,海选了涉及西藏社会和谐度评价的共计78个指标。 然后,根据同类指标信息最优原则选择同类指标中信息量大的指标,根据可观测性原则删除数据无法获得的指标,以保证初次筛选后的指标体系可以量化,定性初选后的指标共61个。

指标的原始数据主要来源于《中国统计年鉴(2015)》《西藏统计年鉴2015(2015)》及相应的问卷调查。

(二)指标的筛选

首先利用公式(1)、(2)对初选后的数据分别进行规范化处理,再利用R软件对初步筛选保留的指标进行信息熵的约简分析。从初步筛选的61个指标中集中删除了16个指标。然后,再计算经过信息熵约简筛选后剩余各准则层内指标的相关系数,给定临界值0.9,删除相关系数大于该临界值的9个指标。这样,经过定量组合筛选指标后,指标体系由初选后的61个指标缩减到36个指标。定量筛选的结果如表1。

表1 西藏社会和谐程度评价指标筛选的信息熵分析和相关性分析

(三)定性分析对指标体系的完善

由于定量方法主要依据数据的变动大小来删除指标,会导致将重要指标由于数据变化不明显而被删除,无法反映和谐社会建设的基本内涵。因此,在定量筛选指标的基础上本文根据权威机构典型文献的高频率原则,以人为本的原则,全面、协调、可持续发展原则补充定量方法剔除的个别指标,实现对指标体系的完善。通过理性分析保留人与社会的和谐准则层中的第一子准则层的农村居民人均纯收入、城镇居民可支配收入,人与社会的和谐准则层的第二子准则层的居民养老保险覆盖率,人与社会的和谐准则层的第四子准则层的刑事案件立案率,人与人的和谐准则层的第一子准则层的恩格尔系数,人与自然和谐的第二子准则层的人均耕地保有量等指标。为此,通过以上方法从78个海选指标中筛选了包含36个指标的西藏和谐社会评价指标体系。

(三)指标体系构建的合理性判定

根据指标原始数据计算各指标的方差,将筛选后的指标方差之和tr(S)k和海选指标的方差之和tr(S)n代入(5)式,得到:

即从海选指标集中筛选出46.15%(36/78=46.15%)的指标反映了93.52%的原始信息,证明所构建的指标体系是合理的。

四、结论

综合评价指标的筛选单纯依靠主观方法或客观的统计学方法都是欠科学的。本文采用定量筛选和定性分析相结合的方法筛选指标,既保证了筛选出的指标在所在准则层中对评价结果影响最大,又避免了同一类指标的信息重复;根据用方差表示信息含量的思路,将筛选后的指标反映的海选指标信息含量作为指标体系构建合理性的判定标准,解决了指标体系的合理性判定缺乏定量标准的问题。 实证分析表明, 最终建立的指标体系,用46.15%的指标反映93.52%的原始信息,体现了和谐社会的内涵,符合西藏和谐社会建设的基本要求。相信在此指标体系的基础上对和谐社会进行评价,将具有客观性、全面性和系统性。

[1] 兰国良.可持续发展指标体系构建及其应用研究[D].天津大学博士学位论文,2004,(5).

[2] 欧阳建国,欧晓万.中国各地区可持续发展主要影响因素的定量研究[J].决策研究,2005,(6).

[3] 李美娟,陈国宏,陈衍泰.综合评价中指标标准化方法研究[J].中国管理科学,2004,(6).

[4] 朱梅红,李爱华.基于熵权的中国西部各省份科技实力综合评价[J].数学实践与认识,2006,(12).

[5] 余锦华,杨维权.多元统计分析与应用[M].中山大学出版社,2006.

[6] 国家统计局课题组. 和谐社会统计监测指标体系研究[J].统计研究,2006(5):23-29.

[7] 梅松,齐心. 和谐社会评价指标体系的构建[J].北京社会科学,2006(1):62-66.

[8] 杜永彬. 关于西藏构建社会主义和谐社会的调查与研究[J].中国藏学,2007(2):6-17.

[9] 张庆红,夏 咏. 新疆和谐社会指标体系构建及综合评价分析[j].新疆社科论坛,2011(6):34-39.

本文是教育部人文社会科学研究西藏项目 “西藏和谐社会建设综合评价的实证研究” (15XZJC910001)和西藏民族大学一般项目“西藏和谐社会指标体系构建与评价方法研究”的阶段性成果。

汪朋(1983-),男,湖北武汉人,在读博士,讲师,统计师,研究方向:统计决策、统计计算、计量经济学和民族经济统计。

猜你喜欢

约简海选信息熵
基于信息熵可信度的测试点选择方法研究
华池县土地利用结构信息熵时空格局演变及机制分析
冰壶项目“跨界跨项”选材海选阶段关键问题分析
带权决策表的变精度约简算法
面向特定类的三支概率属性约简算法
直觉模糊序决策系统的部分一致约简*
近似边界精度信息熵的属性约简
信息熵及其在中医“证症”关联中的应用研究
成都站 海选现场
武汉沌口站 海选现场