APP下载

基于分辨矩阵与层次分析法的组合属性权重决策方法

2022-03-08李天淳

关键词:粗糙集排序权重

吕 康, 叶 军,2, 李天淳

(1.南昌工程学院 信息工程学院,江西 南昌 330099; 2.江西省水信息协同感知与智能处理重点实验室,江西 南昌 330000)

层次分析法(AHP)[1]是一种得到广泛应用的决策方法[2-6],是由专家赋值来确定各属性所占的权重.这种方法过分依赖专家经验,主观性强,使得决策的准确性降低.学者们为此提出了许多客观法来计算属性所占的权重,以改善其过于依赖专家给定权重的情况.较为典型的有利用粗糙集理论[7]中的属性重要度来确定各属性的权重;如文献[8-12]通过基于Pawlak属性重要度定义方法来确定各属性所占权重;文献[13-15]通过粗糙集理论中的条件熵的方法来确定各属性所占权重.这些基于粗糙集理论的客观法完全依赖于历史数据确定属性权重,虽然避免了主观因素的影响,但是这种完全依赖历史数据的粗糙集方法所得到的权重过分注重客观数据,忽略了条件变化带来的影响.

为提高决策精度,众多研究者提出将基于粗糙集理论中的属性重要度与层次分析法相结合来确定各属性的组合权重.如文献[16-18]通过粗糙集中Pawlak权重法和AHP相结合来计算组合权重;文献[19-22]通过粗糙集中的条件熵权重法与AHP法结合来确定组合权重;文献[23]则是通过将模糊数和Pawlak的属性重要度结合起来计算组合权重.这些组合权重方法综合了层次分析法和粗糙集理论的优点,在一定程度上提高了决策准确度.事实上,采用上述2类权重组合方法同样存在不足.基于AHP和Pawlak权重法的组合无法准确得到非核属性的权重;基于AHP和条件熵结合的方法得到的组合权重在某些决策表中会出现非核属性权重度大于核属性权重等问题[13,24].为此,本文中,笔者提出了基于分辨矩阵的属性重要度定义方法,以此来计算各属性的客观权重,并将得到的客观权重与层次分析法得到的主观权重相结合,构造出一种新的组合权重决策方法,该方法能使决策结果更贴近实际,科学合理.

1 相关理论

1.1 层次分析法的相关理论

层次分析法的核心思想是运用1~9之间的9个整数及其倒数作为标度以构造判断矩阵,在判断矩阵满足一致性的条件下得到各层次单排序权向量,最后得到总目标的总排序权向量进行决策.运用层次分析法决策主要有建立层次结构模型、构造判断矩阵、层次单排序及一致性检验、层次总排序及一致性检验4个步骤.具体计算过程如表1所示.

表1 层次分析计算过程

第1步 建立层次模型.将各影响因素按照属性自上而下地分解成若干层次,通常分为目标层、准则层和方案层等.

第2步 构造判断矩阵.从层次结构模型的第2层开始,下一屋的各评价指标对上一层的评价指标的相对重要性,直到最下层.

第3步 一致性检验.层次单排序中,在对同一层次上各属性作两两比较时,不同专家可能会出现前后比较尺度不一致的情况,为避免误差太大,需作一致性检验.

第4步 层次总排序.层次总排序是计算组合属性权向量,为减少误差需要作总一致性检验,通过总一致性检验后得到最终的决策方案.

1.2 粗糙集的相关理论

1.2.1 Pawlak属性重要度定义及确定权重方法

基于Pawlak的属性重要度定义方法是将属性从决策表中删除或添加后,考察决策表中对象分类变化情况.如果将一个属性从决策表中删除或添加后,引起分类对象变化越大,则该属性的重要性度就越大;相反,重要性度就越小.

S(a,C,D)=r(C,D)-r(C-{a},D).

(1)

从条件属性集A⊆C中添加a后,a关于D的重要度为

Sig(a,A,D)=r(A∪{a},D)-r(A,D).

(2)

以每个属性的重要度与所有属性重要度之和的比值来定义各属性重要度所占权重.

定义2[7]决策信息系统S=(U,C∪D,V,f),∀b∈C相对于D的重要度所占权重为

(3)

由对象(1)和(2)可知,Pawlak属性重要度定义是通过改变单个属性来考察正域对象的变化,而能改变正域的只有核属性,所以只有核属性的重要度存在,非核属性的重要度为0.因此,(3)只能得到核属性的重要度权重,非核属性的重要度所占权重为0.显然,这没有合理反映各属性在决策系统中所起的作用.事实上,在由属性表征的决策系统中,每个属性在决策过程中所起的作用可能不一样,核属性作用大,它们在决策系统中所占权重的比例最大;一些普通属性作用小一些,其在决策系统中所占权重的比例相应也小些,另外一些冗余属性可能对决策影响很小甚至可以忽略不计.但是,把普通属性与冗余属性在决策系统中所占权重比例都定义为0,显然有违客观实际.

1.2.2 条件熵属性重要性定义及确定权重方法

下面简要介绍信息论粗糙集下条件熵的属性重要度度量方法.

设子集e为论域U代数上的一个随机变量,则其概率分布定义方法如下定义.

定义3[25]设P,Q在U上导出的划分分别为X,Y(X={X1,X2,…,Xn},Y={Y1,Y2,…,Ym}),则P,Q在U的子集组成的e代数上的概率分布为

(4)

(5)

定义4[25]知识 (属性集合)P的熵H(P)定义为

(6)

定义5(条件熵属性重要度)[25]决策信息系统S=(U,C∪D,V,f),条件属性集C关于决策属性集D的条件熵为

(7)

从条件属性C中删除a后,a关于D的重要度为

S(a,A,D)=H(D|C-{a})-H(D|C).

(8)

从条件属性集A⊆C中添加a后,a关于D的重要度为

S(a,A,D)=H(D|A)-H(D|A∪{a}).

(9)

以每个属性的重要度与所有属性重要度之和的比值来定义各属性重要度所占权重.

定义6(条件熵属性权重)[25]决策信息系统S=(U,C∪D,V,f).∀b∈C关于D的重要度权重为

(10)

条件熵属性重要度定义是通过改变单个属性以考察界域变化情况,所有属性都有可能引起边界域发生变化,因此,在Pawlak定义下重要度为0的属性,在条件熵定义下不为0,从而避免非核属性的重要度都为0的情况.但是,在某些决策表中会得到冗余属性的重要度权重大于核属性的重要度权重的情况[13,24],显然,这不符合事实.

2 基于分辨矩阵的组合权重确定方法

在粗糙集理论中,Pawlak的属性重要度定义是从定性角度反映属性引起正域变化的能力,只有核属性会改变正域,而非核属性不会引起正域变化,它侧重的是核属性作用的度量.为此,文献[25-26]从信息熵的角度提出了粗糙集下基于条件熵的属性重要度定义方法,通过添加或删除某个属性后考查不确定分类变化情况.信息熵的属性重要度定义是从定量角度体现属性引起边界域变化的能力,不管是核属性还是非核属性都可能引起边界域发生变化,它较好地度量了各属性引起边界域变化的作用.但是,在某些决策信息表中会得到非核属性的重要度大于核属性的重要度的情况[13,24],这与粗糙理论中的核属性相矛盾.后续大量采用这2种属性重要度定义方法与层次分析法组合得到的各属性权重存在同样的局限性[16-22].为合理度量属性在决策系统中所起的作用,给出了一种分辨矩阵属性重要度定义方法,该定义不仅得到核属性和普通属性的重要度,同时可避免冗余属性重要度大于核属性重要度的情况,并与层次分析法进行组合,给出一种组合属性权重方法.

2.1 分辨矩阵的属性重要度定义及确定方法

定义7(分辨矩阵)[27]决策信息系统S=(U,C∪D,V,f).其中,C为条件属性集,D为决策属性集,论域是对象的一个非空有限集合U={x1,x2,x3,…,xn},|U|=n,则定义决策系统的分辨矩阵为

(11)

其中i,j=1,2,…,n.

(12)

文献[28]中的定理1给出了分辨矩阵中求核属性集方法,该方法简单高效[29].

定理1[28]决策信息系统S=(U,C∪D,V,f),其中C为条件属性集,D是决策属性集,在分辨矩阵中,所有单个属性元素组成的集合就是C相对D的核属性集.

由定义7可知,属于同一个等价的对象无法区分,其条件属性子集为空,即eij=∅.当对象属于不同等价类时,这些对象能够被条件属性子集区分,即有eij≠∅,其中eij中可能包含了核属性,也可能包含普通或冗余属性,eij中的所有属性在分辨不同等价类中的对象Xi和Xj时都起了作用,只是作用不一样,核属性的作用应该最大,其他属性贡献要小.为能够准确度量各条件属性在分辨不同对象所起的作用,以这些条件属性在eij中出现的频次及在每次所占权重来度量其重要度[30].

定义8(分辨矩阵属性重要度) 决策信息系统S=(U,C∪D,V,f),其中C为条件属性集,D为决策属性集.分辨矩阵M中的非空集合记为eij,分辨矩阵中所有非空集合eij的总个数记为N,∀c∈C,属性c关于D的重要程度定义为

(13)

从定义8中(13),可以得到几个性质[29-30].

性质1对分辨矩阵M中的非空元素集合eij,若∀c∈eij⊆C,则有NS(c,C,D)>0.

证对c∈eij,若eij为单个属性时,根据(13)可知NS(c,C,D)=1.若eij为多个属性组成的集合时,即

从性质1可以看出,出现在集合eij中的属性在分辨不同等价类的对象时都起了作用,其属性的重要度都大于0,避免了Pawlak属性重要度定义方法中非核属性重要度都为0的情况[30].

性质2对分辨矩阵M中的非空元素集合eij,∀a,b∈eij,若a∈CH(C),b∈N,则有NSa>NSb>0.其中,CH(C)表示核属性集合,N表示非核属性集.

证若a∈CH(C)且a∉N,则有NSa=1>0.

综上所述可得NSa>NSb>0.

性质2解决了冗余属性重要度的值比核属性值大的问题.

上述2条性质反映了分辨矩阵属性重要度定义方法合理度量了各属性在分辨对象时所起的作用.因此,在定义8的基础上,可以得到属性所占权重的方法.

定义9(分辨矩阵属性权重) 决策信息系统S=(U,C∪D,V,f).eij为区分矩阵M中的非空元素,∀c∈C,属性c关于D的重要度所占权重为

(14)

对于定义9有以下性质3.

性质3对分辨矩阵M中的非空元素集合eij,∀b1,b2∈eij⊆C,若有b1∈CH(C),b2∈N,则有WN(b1)>WN(b2)>0.其中,N表示非核属性集.

证由性质1和性质2直接得证.

由性质3可知,定义9得到了分辨矩阵中所有属性的权重,而且核属性的权重比非核属性权重大.显然,定义9合理度量了各属性所占的权重,它改善了定义2和定义6中非核属性权重为0和非核属性权重度大于核属性权重的情况.

2.2 基于分辨矩阵-AHP确定属性组合权重方法

利用分辨矩阵确定的属性客观权重与层次分析法确定的属性主观权重组合来构建新的最优化模型,通过构建Lagrange函数求得最优解.

设决策信息系统S=(U,C∪D,V,f),由层次分析法得到主观属性权重记为wAi,由分辨矩阵方法得到客观属性权重为wRi,两者组合权重为wi,经过归一化处理后得

(15)

0≤wAi,wRi,wi≤1(i=1,2,…,m).

建立最优化模型:

(16)

(17)

定理2最优化模型(1)在可行域上有唯一解, 且其解为

wi=μwAi+(1-μ)wRi,i=1,2,…,m.

(18)

构建并证明如下Lagrange函数:

(19)

(20)

解得wi=μwAi+(1-μ)wRi,故定理得证.

3 实例应用

选择对数据库系统健康评价作为实例来验证本文方法的有效性.从阿里云数据库健康诊断评价标准方案中,选择如图1所示的7个评价指标属性来进行评价.

图1 数据库系统健康层次分析模型

引用文献[21]中的实验数据,用本文方法与基于代数粗糙集方法及粗糙信息熵方法得到的组合属性权重进行对比分析.

3.1 AHP法确定主观属性权重

由图1所示的层次模型构造出判断矩阵,具体计算步骤如下:

1) 通过专家经验对c1,c2,…,c7进行两两对比,运用AHP法得到的判断矩阵C

2) 利用求和法对判断矩阵C按列归一化得C′

3) 对矩阵C′按行求和得V

V=(0.622,0.718,0.711,0.711,2.059,1.082,1.103)T.

4) 对矩阵V归一化得各属性的权重系数

W=(0.089,0.102,0.101,0.101,0.294,0.154,0.157)T.

5) 进行一致性检验

通过层次分析法得到的各个属性权重为W=(0.089,0.102,0.101,0.101,0.294,0.154,0.157)T,根据求出的每个属性的权重可以得出,c5是最重要的属性,然后依次是c7,c6,c2,c3,c4,c1.

3.2 分辨矩阵法确定客观属性权重

以c1,c2,…,c7作为条件属性C,决策属性D={d},属性值域V={0,1,2}.其中, 数据库系统健康状况良好记为“0”;数据库系统健康状况一般记为“1”;数据库系统健康状况较差记,为“2”.

以下9个煤矿的相关数据取自文献[21],经过处理得到数据库系统健康诊断决策表,见表2.

表2 数据库系统健康诊断决策

论域U对c1,c2,…,c7进行分类得

U/(c1)={{1,2,3,5,6,9},{4},{7,8}},

U/(c2)={{1,2,3,5},{4,7,8,9},{6}},

U/(c3)={{1,3,5},{2,4,6,7,8,9}},

U/(c4)={{1,2,4,5,6},{3,7,8,9}},

U/(c5)={{1,3,5,9},{2,4,8},{6,7}},

U/(c6)={{1,2,4,6},{3,7,8},{5,9}},

U/(c7)={{1,3,9},{2,4,5,6},{7,8}}.

则论域U对所有条件属性C的分类为

U/(C)={{1},{2},{3},{4},{5},{6},{7},{8},{9}}.

论域U对决策属性D的分类为

U/(D)={{1,3,6,8},{2,4,5,9},{7}}.

计算得到的正域为

PC(D)={1}∪{2}∪{3}∪{4}∪{5}∪{6}∪{7}∪{8}∪{9}=

{1,2,3,4,5,6,7,8,9}=U.

依次去除条件属性c1,c2,…,c7,论域对条件属性的分类分别为

U/(C-c1)={{1},{2},{3},{4},{5},{6},{7},{8},{9}},

U/(C-c2)={{1},{2},{3},{4},{5},{6},{7},{8},{9}},

U/(C-c3)={{1},{2},{3},{4},{5},{6},{7},{8},{9}},

U/(C-c4)={{1},{2},{3},{4},{5},{6},{7},{8},{9}},

U/(C-c5)={{1},{2},{3},{4},{5},{6},{7,8},{9}},

U/(C-c6)={{1},{2},{3},{4},{5},{6},{7},{8},{9}},

U/(C-c7)={{1},{2},{3},{4},{5},{6},{7},{8},{9}}.

由此得到D相对于去除c1,c2,…,c7后的条件属性的正域为

PC-c1(D)={1,2,3,4,5,6,7,8,9}=PC(D),

PC-c2(D)={1,2,3,4,5,6,7,8,9}=PC(D),

PC-c3(D)={1,2,3,4,5,6,7,8,9}=PC(D),

PC-c4(D)={1,2,3,4,5,6,7,8,9}=PC(D),

PC-c5(D)={1,2,3,4,5,6,9}≠PC(D),

PC-c6(D)={1,2,3,4,5,6,7,8,9}=PC(D),

PC-c7(D)={1,2,3,4,5,6,7,8,9}=PC(D).

由粗糙集理论中约简的相关知识得到决策表的核集为CH(C)={c5},约简集为Cr(C)={{c5,c6},{c5,c7}}.

根据定义3分别计算得到以下各属性集合.

核集 CH(C)={c5}.

首先,计算代数粗糙集方法下属性重要度确定的属性权重.

根据定义1,可分别计算得到各属性的重要度为

S(c5)=0.222,

S(c1)=S(c2)=S(c3)=S(c4)=S(c6)=S(c7)=0.

因此,根据定义2,各属性重要性所占的权重分别为,

W(c5)=1,

W(c1)=W(c2)=W(c3)=W(c4)=W(c6)=W(c7)=0.

从以上结果可知,核属性c5权重值为1且最大,说明了它的决策能力最强,与核属性的性质一致;而非核属性的权重都为0,显然,没有反映它们在决策系统中的作用.

其次,采用条件熵来确定属性权重.

根据定义3,可分别计算得到各属性的重要度为

S(c1)=0.158,S(c2)=0.158,S(c3)=0.105,

S(c4)=0.105,S(c5)=0.183,S(c6)=0.158,

S(c7)=0.158.

因此,各属性重要性所占的权重分别为

W(c1)=0.161,W(c2)=0.136,W(c3)=0.169,

W(c4)=0.150,W(c5)=0.141,W(c6)=0.122,

W(c7)=0.122.

从以上计算结果可知,核属性c5=0.141的权重小于非核属性c1=0.160,c3=0.169和c4=0.150的权重,这与核属性的分类能力最大相矛盾.

最后,用本文分辨矩阵方法计算属性权重.根据定义5和表1得到的分辨矩阵为

根据定义6,可以得到分辨矩阵中非空元素有24个,记为N=24.各属性在分辨矩阵下的重要度如下:

同理可得

NS(c1)=0.128,Ns(c2)=0.131,NS(c3)=0.097,

NS(c4)=0.107,Ns(c6)=0.173,NS(c7)=0.169.

从上述结果可知,所有属性的重要度大小均大于0,与性质1吻合;核属性c5的重要度最大,与性质2一致,因此,各属性重要性所占的权重分别为

WN(c1)=0.064,WN(c2)=0.066,WN(c3)=0.049,WN(c4)=0.054,WN(c5)=0.597,WN(c6)=0.087,WN(c7)=0.085.

以上得到的各属性重要度权重与本文的性质3完全一致.

排序结果依次为c5,c6,c7,c2,c1,c4,c3.

3.3 分辨矩阵-AHP法确定组合属性权重

把3.1中层次分析法与3.2中分辨矩阵得到的各属性权重值代入公式wi=μwAi+(1-μ)wRi求组合权重.其中,μ∈[0,1].可以根据实际情况选择合适的的当μ值.当决策倾向专家经验时μ∈[0.5,1];决策注重客观数据时μ∈[0,0.5].为便于比较,本文及其他文献中的u都取中间值u=0.5,得到组合权重结果如下:

W1=0.074,W2=0.084,W3=0.075,W4=0.082,W5=0.415,W6=0.134,W7=0.135.

最终得到各属性组合权重排序依次是c5,c7,c6,c2,c4,c3,c1.

3.4 比较分析

用上述计算得到的组合权重与文献[16]中的Pawlak-AHP法和文献[21]中条件熵-AHP进比较.3种方法下的组合权重排序结果见表3,并且将每种方法的组合权重下各属性的大小进行比较,比较结果见图2.

表3 各属性权重排序结果

图2 各属性权重大小比较

由表3分析可知,利用Pawlak-AHP方法得到的属性权重,由于非核属性的权重都为0,所以除了核属性之外,其他属性的组合权重基本与主观权重保持一致,并未做到明显的改善.由条件熵-AHP方法计算得到的属性权重,存在非核属性权重大于核属性权重的情况,虽然在组合属性权重计算后该情况得到改善,但是由于客观权重的原因,使得排序结果与专家意见相差较大.用分辨矩阵-AHP方法得到的属性权重明显更为合理,不仅改善了非核属性为0的情况,还突出了核属性以及必要属性的重要程度,提高了决策精度.

4 对比其他文献中案例

为进一步证明本文方法的有效性,选取文献[31]中某企业某类型职位的岗位薪酬体系设计案例.用本文方法、文献[16]中的Pawlak-AHP法、文献[21]中的条件熵-AHP和文献[31]中的方法得到的结果进行比较,4种方法计算得到的组合权重排序结果见表4,并且将每种方法的组合权重下各属性的大小进行比较,比较结果见图3.

表4 各属性权重排序结果

图3 各属性权重大小比较

由表4和图3分析可知,Pawlak-AHP法得到的非核属性的组合权重实际上是AHP法得到的主观权重,并未改善主观性强的问题.条件熵-AHP法得到的结果同样出现了非核属性权重大于核属性权重的情况.文献[31]中的方法改善了非核属性为0的情况,但是属性b和属性d、属性e和属性f的权重取值一样,而且存在核属性c的权重值小于非核属性f的权重值的情况.本文方法得到的各属性的权重与性质3完全一致.

再选取文献[32]中对施工安全管理制度的评价案例进行比较,4种方法下的组合权重排序结果见表5,并且将每种方法的组合权重下各属性的大小进行比较,比较结果见图4.

从表5和图4可以看出,其得到的结果与表4和图3类似.基于分辨矩阵-AHP决策主法合量了各属性在决策过程中所起的作用,说明了本文方法具有实用性.

表5 各属性权重排序结果

图4 各属性权重大小比较

5 结束语

本文中,笔者给出的分辨矩阵属性重要度定义,从定性和定量2个角度改善了非核属性重要度为0及冗余属性重要度大于核属性重要度的情况.它合理度量了各属性在决策系统中所起的作用.在此基础上提出的分辨矩阵-AHP组合属性权重方法,改进了Pawlak-AHP法和条件熵-AHP法存在的不足,提高了决策精度,为决策者提供了另一种思路.但是,笔者提出的组合权也存在局限性,一是少数决策表中,并不是所有属性都会出现在分辨矩阵中,没有出现在区分矩阵eij集合中的属性其重要度权重也可能是0;二是它适应于处理离散型决策表数据.事实上,在实际应用中存在许多连续型数据.因此,如何优化定义及应用于连续型决策表数据是下一步研究的方向.

猜你喜欢

粗糙集排序权重
粗糙集与包络分析下舰船运行数据聚类算法
基于隶属函数的模糊覆盖粗糙集新模型
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
作者简介
权重常思“浮名轻”
恐怖排序
多粒度犹豫模糊粗糙集*
粗糙集的Mallow’s Cp选择算法*
节日排序
为党督政勤履职 代民行权重担当