APP下载

一种新的白化权函数的灰色聚类评价方法

2015-02-25李志亮罗芳阮群生

关键词:白化灰色权重

李志亮, 罗芳, 阮群生

( 宁德师范学院 计算机系, 福建 宁德 352100 )



一种新的白化权函数的灰色聚类评价方法

李志亮,罗芳,阮群生

( 宁德师范学院 计算机系, 福建 宁德 352100 )

摘要:在传统三角白化权函数的基础上,构建一个新的正弦曲线形式的白化权函数,以提高聚类对象划分为其所属灰类的聚类系数,继而建立一种灰色聚类评价改进方法.经仿真实验发现,改进方法能够有效降低聚类信息熵的值,并能提高聚类对象的归属性.通过引用研究生招生实际数据,分析验证了改进的灰色聚类评价方法在招生质量评价应用中的可行性和有效性. 正弦曲线; 白化权函数; 灰色聚类; 招生质量评价 N941.5

文献标识码:A

0引言

灰色系统理论是邓聚龙于2002年首次提出的一种基于小样本的计算方法[1],随后许多学者应用灰色理论的灰色聚类方法建立了聚类模型,例如:刘思峰等在2013年设计了加权多属性灰色目标决策模型[2],并且2014年在传统白化权函数的基础上,改进三角白化权函数,构建了一种新的灰色聚类决策模型[3],该决策模型有效提高了信息决策的准确度;金灿灿等[4]运用SDG模型并结合灰色聚类技术提出了系统故障风险评估方法;王沛[5]应用灰色聚类技术建立了研究生生源质量评价方法;龙伟等[6]运用灰色聚类技术建立了投标决策评价模型.上述研究成果均取得了一定的效果,并在相应的领域得到了较好的应用,但他们建立的白化权函数都是直线型的分段函数.对此,一些学者对直线型的白化权函数进行了改进,例如:徐卫国等[7]通过建立指数型白化权函数,解决了零权重现象;胡军等[8]应用指数型白化权函数建立了大气环境质量综合评价灰色聚类模型;王国胜等[9]引入正态分布白化权函数,有效解决了聚类边缘的零权重问题.但是,这些基于传统白化权函数或改进的指数型白化权函数的评价方法都是采用最大归属原则,即通过最大归属原则来划分聚类对象所属的灰类.该方法虽然能够得到明确的聚类结果,但是实际的聚类结果难以明确划分聚类对象所属的灰类,即聚类对象划分为不同灰类的聚类系数的值差别不大.

本文在研究传统白化权函数的基础上,建立了一种正弦曲线的白化权函数,以提高聚类对象划分为其所属灰类的聚类系数,继而构建了一种基于正弦曲线的白化权函数的灰色聚类评价方法;通过实验仿真验证了改进评价方法的有效性和合理性,并把它应用于研究生招生质量评价中,通过实例进一步验证了评价方法的实际效果.

1概念与定义

首先给出与本研究相关的一些概念和定义.

定义1设有m个聚类对象,灰色聚类对象记为i, i∈[1,m]; 每个聚类对象有n个聚类指标,用j表示每个聚类指标的序号, j∈[1,n]; 聚类对象的划分灰类有s个,用k表示灰类序号, k∈[1,s]; 将m个对象划分为s个灰类的过程称为灰色聚类.

定义3用Mij表示m个灰色对象中的第i个对象的第j个聚类指标的值, i∈[1,m], j∈[1,n].灰色聚类对象的评价指标矩阵M定义如下:

(1)

(2)

(3)

2改进的灰色聚类评价方法的设计过程

本文运用式(2)所示的正弦函数构建灰色聚类评价方法,具体步骤如下:

1)构建聚类对象的评价指标矩阵.假设聚类对象个数为m, 聚类评价指标数为n, 由定义3可知,第i个灰色聚类对象的第j个聚类指标的值为Mij,i∈[1,m],j∈[1,n], 经归一化处理得到由Mij可生成聚类对象的评价指标矩阵,记为Mm×n.

3)构建基于正弦函数的改进的白化权函数模型.传统白化权函数有上限测度白化权函数、下限测度白化权函数和中心点白化权函数,函数图形都是直线形式.本文基于正弦函数的改进的白化权函数模型对传统白化权函数进行改进,这里灰类1采用下限测度白化权函数,灰类s采用上限测度白化权函数,灰类k采用中心点白化权函数,即在传统白化权函数的基础上,把直线形式的白化权函数改进为正弦函数曲线形式的白化权函数,具体形式如式(4)至式(6)所示:

(4)

(5)

(6)

构造的基于正弦函数的白化权函数示意图如图1所示.

图1 基于正弦函数的白化权函数图

4)确定聚类指标权重.聚类指标权重的确定对模型评价至关重要,国内外很多学者对指标权重的确定提出了很多方法,这些方法总体上可以将指标权重分为主观权重和客观权重.主观权重可采用层次分析法[10]等得到,客观权重可采用离差最大化法[11]等得到,也可以采用主观、客观组合方法来得到权重系数,即通过组合赋权法[12]可有效地融合主、客观权重,进而得到灰色聚类的指标权重.当然,也可以根据实际情况直接确定指标权重的值.本文改进灰色聚类方法的聚类指标权重由式(7)确定:

(7)

3仿真实验

实验采用文献[13]中的SCCTS数据集,算法编程工具采用VC++,实验环境为:64位WIN7操作系统,处理器为Intel(R)Core(TM)i7-5500,运算速度是2.40GHz,内存(RAM)为8GB.采用文献[13]中的SCCTS数据集检验改进的灰色聚类评价方法,在仿真实验中灰类数m=3.SCCTS数据集可以有效地测试算法性能的数据集,数据量超过6万条,在数据集中随机抽取100条数据作为数据子集来验证算法的性能.图2和图3分别是阈值设为0.48时采用文献[5]方法和本文改进方法的聚类结果图.

图2 文献[5]方法聚类结果图

图3 本文改进方法聚类结果图

由图2和图3可以看出,图3中聚类结果明显更为紧凑,即聚类结果具有更高的确定性,各个灰类之间聚类对象的紧密性更好.由此说明采用本文改进方法可以更好地对聚类对象进行聚类.

在测试的数据子集上,阈值设为0.48,文献[5]方法的聚类准确性是92%,本文改进方法的聚类准确性为95%.表1是文献[5]方法和本文改进方法在阈值为0.48时得到的聚类结果,表格数据包括正确划分的个数和错误划分的个数,错误个数包括错误的聚类结果或没有明确划分聚类结果的评价结果.

表1 两种评价方法的聚类结果

由表1的实验结果可以看出,本文的改进评价方法在准确率上优于文献[5]的评价方法.这是因为,采用正弦形式的白化权函数,对聚类对象划分为所属灰类的聚类系数提高得较多,而对聚类对象不归属灰类的聚类系数提高得相对较少,所以提高了聚类对象划分为所属灰类的确定性,因此可以更准确地提升聚类的准确性.

信息熵的值可以作为聚类对象之间相似度的度量,信息熵的值越小,则表明聚类对象划分为所属类越明确,即处在同一个类的聚类对象具有更高的相似度,也说明聚类结果越准确.表2给出了在划分不同灰类数时,采用文献[5]方法和本文改进方法所得的信息熵值.

表2 两种方法不同灰类数的熵值表

由表2可以看出,采用本文的改进方法可以有效地降低信息熵的值,说明聚类结果更为准确.两种方法在灰类数为2时,聚类的熵值最小;随着灰类数的增多,信息熵值逐渐增大,本文改进方法的熵值增长趋势相对平缓,这也证明了本文改进方法对聚类准确性的提高.

4实例分析

研究生生源质量对于提高研究生教育有着重要的影响,因此,为了更好地指导研究生招生工作,需要建立一种科学有效的研究生招生质量评价方法.为此,近年来国内外很多学者进行了大量的研究,取得了诸多成果[14-15];部分学者对影响研究生招生质量的因素设置了权重,但没有给出具体的评价模型[16];部分学者建立了评价模型,但是其评价过程的实施比较复杂[17].为了验证本文改进聚类方法的有效性,本文引用文献[5]的数据,并与文献[5]中的聚类结果作比较.白化权函数的临界值和各指标对应灰类的权值取值沿用文献[5]的结果,其中聚类对象m=14,聚类指标n=7,划分的灰类s=3.改进的灰色聚类过程如下:

1)构建聚类对象的评价指标矩阵.对文献[5]中表3的数据进行归一化处理,即Mij=Mij/max(Mij)×100, 这里 1≤j≤n.根据M=(Mij)m×n可得到灰色聚类的指标矩阵M:

表3 聚类过程中3个灰类的转折点与中心点

3)构建基于正弦函数的改进的白化权函数模型.由步骤2)得到灰类的转折点和中心点,并确定每个评价指标相对应的转折点和中心点,再结合公式(4)—(6)得到3个灰类的白化权函数.基于正弦函数的改进的白化权函数如下:

4)确定聚类指标权重.根据聚类指标权重公式(7)计算求得灰类k关于指标j的权值,具体数值如表4所示.

表4 灰类k关于指标j的权值

表5 某高校2015年研究生招生质量聚类系数

按文献[5]方法,若设定阈值为0.48,则招生质量为“优秀”类的专业有通信与信息系统、移动互联网和集成电路系统设计;招生质量为“一般”类的专业有电子与通信工程、软件工程、大数据处理与高性能计算、企业管理、马克思主义理论;招生质量为“良好”类的专业有信号与信息系统、电路与系统和会计.信息安全、电磁场与微波技术介于“优秀”类专业和“良好”类专业之间,微电子学与固体电子学介于“一般”类专业和“良好”类专业之间.表6给出了阈值为0.48时两种方法对文献[5]中的数据进行灰色聚类的结果.

表6 阈值为0.48时本文改进方法和文献[5]方法的聚类结果

由表6可知,采用本文改进算法可以较好地对聚类对象进行灰类划分.在采取相同阈值的情况下,14个聚类对象采用本文改进方法可以明确地划分13个聚类对象的灰类,只有1个“微电子与固体电子学”专业不能明确划分招生质量灰类;文献[5]方法则只能划分11个聚类对象的招生质量灰类,“信息安全”“微电子学与固体电子学”“电磁场与微波技术”3门专业不能具体地划分招生质量灰类.划分为优秀的专业都是该高校的优势专业,尤其是“通信与信息技术”专业是“优秀”灰类聚类系数值最高的,这与其作为该高校的热门专业的实际情况相符.

5结束语

本文通过改进灰色聚类中的三角白化权函数,建立了一种新的基于正弦曲线形式的灰色聚类评价方法,并通过仿真实验验证了新的改进方法的准确性和一致性.通过研究生招生质量评价的实例分析表明,本文改进的灰色聚类方法可以对研究生招生质量的评价提供量化支持,能够有效降低研究生招生质量评价的主观性.今后将进一步研究不相邻区间对聚类系数的影响,以提高灰色聚类方法的综合评价准确性,更好地解决不相邻区间的零权重问题;以及建立新的灰色聚类方法的实际应用模型,扩大灰色聚类方法的应用范围.

参考文献:

[1]邓聚龙.灰理论基础[M].武汉:华中科技大学出版社,2002:1-46.

[2]LiuSF,XuBin,JeffreyForrest,etal.Onuniformeffectmeasurefunctionsandaweightedmulti-attributegreytargetdecisionmodel[J].JofGreySystem, 2013,25(1):1-12.

[3]刘思峰,方志耕,杨英杰.两阶段灰色综合测度决策模型与三角白化权函数的改进[J].控制与决策,2014,29(7):1232-1238.

[4]金灿灿,王海燕,左洪福,等.基于SDG和灰色聚类的系统故障风险评估方法[J].系统工程理论与实践,2015,35(4):1048-1056.

[5]王沛.基于灰色聚类的研究生生源质量评价方法[J].西安邮电大学学报,2015,20(4):120-124.

[6]龙伟,邓龙.灰色聚类分析法在投标据测中的应用[J].海峡大学学报(自然科学版),2015,32(2):87-93.

[7]徐卫国,张清宇,郭慧,等.灰色聚类模型的改进及应用研究[J].数学的实践与认识,2006,36(6):200-205.

[8]胡军,许丽忠,张江山.基于改进灰色聚类法的大气环境质量综合评价[J].福建师范大学学报(自然科学版),2012,28(1):49-54.

[9]王国胜,冉治霖,黄奕崇,等.改进灰色聚类法在粤港珠江三角洲区域大气环境质量评价中的应用研究[J].深圳信息职业技术学院学报,2015,13(1):63-67.

[10]马农乐,赵中极.基于层次分析法及其改进对确定权重系数的分析[J].水利科技与经济,2006,12(11):732-733.

[11]董一哲,党耀国.基于离差最大化法的灰色聚类方法[J].系统工程理论与实践,2009,29(9):141-146.

[12]陈伟,夏建华.综合主、客观权重信息的最优组合赋权方法[J].数学的实践与认识,2007,37(1):17-21.

[13]王元珍,王健,李晨阳.一种改进的模糊聚类算法[J].华中科技大学学报(自然科学版),2005,33(2):92-94.

[14]侯俊,陈安民.研究生招生质量评估体系研究[J].学位与研究生教育,2007(7):22-25.

[15]陈立文,陈书娜.学术型硕士研究生生源质量评价研究进展[J].续教育研究,2011(10):94-97.

[16]许朝辉,高万林,张领先,等.基于AHP的研究生生源素质评价[J].北京航空航天大学学报(社会科学版),2007(20):9-11.

[17]徐瑾,岳昆,钱文华,等.一种基于概率图模型的研究生生源质量评价方法[J].云南大学学报(自然科学版),2011,33(S2):299-304.

A gray clustering evaluation method based on new whitenization weight function

LI Zhiliang,LUO Fang,RUAN Qunsheng

(DepartmentofComputerScience,NingdeNormalUniversity,Ningde352100,China)

Abstract:On basis of the traditional triangular whitenization weight function, a new form of whitenization weight function based on sine curve is built in this paper. It can improve the clustering ratio of clustering object belonged to gray class. Then an improved method of gray clustering method is given.Simulation experimental results show that the improved method can effectively reduce the value of information entropy and increase the certainty of clustering objects attribution. With the actual data of graduate student’s enrollment cited, the feasibility and effectiveness of the improved gray clustering evaluation method is detailedly analyzed.

Key words:sine curve; whitenization weight function; gray cluster; enrollment quality evaluation

文章编号:1004-4353(2015)04-0318-08

基金项目:福建省自然科学基金资助项目(2011J01357);宁德师范学院服务海西资助项目(2012H405);福建省大学生创新创业训练计划项目(201410398059)

收稿日期:2015-11-03

作者简介:李志亮(1981—),男,讲师,研究方向为不确定系统理论.

猜你喜欢

白化灰色权重
甘肃东部记录到山噪鹛白化型雏鸟
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
江西发现一例白化王锦蛇
权重常思“浮名轻”
浅灰色的小猪
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
灰色时代
她、它的灰色时髦观
感觉