APP下载

基于正弦函数的直觉模糊集相似度测量及其应用*

2018-01-26张东升王艳茹张亚男

计算机工程与科学 2018年1期
关键词:论域模糊集余弦

杨 勇,张东升,王艳茹,张亚男

(西北师范大学计算机科学与工程学院,甘肃 兰州 730070)

1 引言

1965年,Zadeh[1]提出了模糊集理论,该理论为处理不精确、不确定的数据和信息提供了一个重要工具。Atanassov[2]于1986年对模糊集进行拓展,给出了直觉模糊集概念,由于它同时考虑隶属度、非隶属度和犹豫度三方面的信息,因此与模糊集相比,直觉模糊集在处理信息的模糊性和不确定性时更具有灵活性和实用性。Gau和Buehrer[3]于1993年定义了Vague集概念,后来Bustince和Burillo[4]证明了Vague集就是直觉模糊集。

相似度测量是度量两个对象之间相似程度的一个重要方法,它在决策分析[5]、模式识别[6]和医疗诊断[7]等领域得到广泛应用。1995年Chen[8]将相似度引入Vague集,1999年Hong 和Kim[9]对Chen的方法进行改进。2002年Li和Cheng[10]提出了一种测量两个直觉模糊集间相似程度的计算公式,并将其用在模式识别中。2011年Ye[11]利用向量的知识定义了余弦相似度测量公式,但该公式在某些情况下会出现不合理现象,为弥补该缺陷,Shi和Ye[12]通过考虑隶属度、非隶属度和犹豫度三方面的信息对文献[11]中的公式进行改进,提出余弦相似度测量公式的另外一种形式。接着2013年Tian[13]给出了基于余切函数的相似度测量公式,使计算过程更加简单化。受文献[11]和文献[13]中相似度测量公式的启发,本文对三角相似度测量进一步拓展,提出基于正弦函数的相似度测量公式,并应用于医疗诊断和汽车发动机的设计方案决策中。

2 预备知识

定义1设X为论域,其中任意一个元素用x表示,则在X上的直觉模糊集A定义为:A={〈x,μA(x),vA(x)〉|x∈X},其中μA(x)和vA(x)分别表示成员隶属度和非成员隶属度,即μA(x):X→[0,1],vA(x):X→[0,1],并且需满足条件0≤μA(x)+vA(x)≤1。此外,πA(x)=1-μA(x)-vA(x),x∈X,表示X中x属于A的犹豫度或不确定度。

设A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}为论域X上的两个直觉模糊集,则:

(1)A⊆B当且仅当μA(x)≤μB(x),vA(x)≥vB(x),x∈X。

(2)A=B当且仅当μA(x)=μB(x),vA(x)=vB(x),x∈X。

定义2设A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}为论域X上的两个直觉模糊集,S为一个映射:IFS(x)×IFS(x)→[0,1],如果它满足下面4个条件:

(S1) 0≤S(A,B)≤1;

(S2)S(A,B)=1当且仅当A=B;

(S3)S(A,B)=S(B,A);

(S4) 若A⊆B⊆C,有S(A,C)≤S(A,B),S(A,C)≤S(B,C)。

则称S(A,B)为直觉模糊集A和B之间的相似度。

Ye在文献[11]中利用向量的知识提出了如下基于余弦函数的相似度测量公式:

C1(A,B)=

(1)

通过研究发现,在该余弦相似度测量公式中,如果μA(xj)=vA(xj)=0或μB(xj)=vB(xj)=0,则该公式就会出现分母为零的现象。在这种情况下,该公式就不能用于计算直觉模糊集A和B之间的相似度测量值。另外,如果μA(xj)=kμB(xj),vA(xj)=kvB(xj),其中k≠1,xj∈X(j=1,2,…,n),即A≠B,则用公式(1)来计算相似度测量值,其结果都等于1。在这种情况下该公式不满足定义2中的条件(S2)。

为了弥补公式(1)的不足,通过引入隶属度、非隶属度和犹豫度三方面的信息,Shi和Ye在文献[12]中提出了余弦相似度测量公式的另外一种形式。

vA(xj)vB(xj)+πA(xj)πB(xj))/

(2)

Tian在文献[13]中提出了如下直觉模糊集之间的余切相似度测量公式:

(3)

在实际应用中,直觉模糊集中每个元素的权重往往是不相同的,因此在文献[11 - 13]中分别提出了如下直觉模糊集之间加权的余弦相似度测量公式和余切相似度测量公式:

WC1(A,B)=

(4)

vA(xj)vB(xj)+πA(xj)πB(xj))/

(5)

(6)

3 正弦相似度测量

3.1 正弦相似度测量公式的定义

设A和B为论域X={x1,x2,…,xn}上两个直觉模糊集,则分别定义A和B之间的两个正弦相似度测量公式SN1(A,B)和SN2(A,B)如下:

μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-

(7)

μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-

(8)

3.2 正弦相似度测量公式证明

证明

(S1)与(S3)显然成立,下面只证明(S2)和(S4)。

(S2) 设A和B是论域X={x1,x2,…,xn}上的两个直觉模糊集,若A=B,则有μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),xj∈X,j=1,2,…,n,得|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0。故,SNk(A,B)=1,其中k=1,2。

反之,若SNk(A,B)=1,k=1,2,有|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0,xj∈X,j=1,2,…,n。所以μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),x∈X。故,A=B。

(S4) 如果A⊆B⊆C,有μA(xj)≤μB(xj)≤μC(xj),vA(xj)≥vB(xj)≥vC(xj),xj∈X,j=1,2,…,n。可得:

|μA(xj)-μB(xj)|≤|μA(xj)-μC(xj)|

(a)

|μB(xj)-μC(xj)|≤|μA(xj)-μC(xj)|

(b)

|vA(xj)-vB(xj)|≤|vA(xj)-vC(xj)|

(c)

|vB(xj)-vC(xj)|≤|vA(xj)-vC(xj)|

(d)

(1)k=1。

由πA(xj)=1-μA(xj)-vA(xj),πB(xj)=1-μB(xj)-vB(xj),πC(xj)=1-μC(xj)-vC(xj),

可得:

|πA(xj)-πB(xj)|=

|(1-μA(xj)-vA(xj))-(1-μB(xj)-vB(xj))|=

|(μB(xj)-μA(xj))+(vB(xj)-vA(xj))|≤|μB(xj)-μA(xj)|∨|vB(xj)-vA(xj)|

|πA(xj)-πC(xj)|=

|(1-μA(xj)-vA(xj))-(1-μC(xj)-vC(xj))|=

|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|≤|μC(xj)-μA(xj)|∨|vC(xj)-vA(xj)|

从而,

|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|=

|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|

|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|=

|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|

因此,

|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|≤

|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|

同理,

|μB(xj)-μC(xj)|∨|vB(xj)-vC(xj)|∨|πB(xj)-πC(xj)|≤

|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|

故SN1(A,C)≤SN1(B,C)。

(2)k=2。

由条件可得:

|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=

μB(xj)-μA(xj)+vA(xj)-vB(xj)+|μB(xj)-μB(xj)+(vB(xj)-vA(xj))|

|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=

μC(xj)-μA(xj)+vA(xj)-vC(xj)+|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|

①当μB(xj)-μA(xj)≥vB(xj)-vA(xj)时,

|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(μB(xj)-μA(xj))

②当μB(xj)-μA(xj)≤vB(xj)-vA(xj)时,

|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(vA(xj)-vB(xj))

③ 当μC(xj)-μA(xj)≥vC(xj)-vA(xj)时,

|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(μC(xj)-μA(xj))

④ 当μC(xj)-μA(xj)≤vC(xj)-vA(xj)时,

|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(vA(xj)-vC(xj))

由式(a)及①④可得:

vC(xj)-vA(xj)≥μC(xj)-μA(xj)≥

μB(xj)-μA(xj)≥vB(xj)-vA(xj)

由(c)及②③可得:

μC(xj)-μA(xj)≥vC(xj)-vA(xj)≥

vB(xj)-vA(xj)≥μB(xj)-μA(xj)

因此,

|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|≤

|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|

同理,

|μB(xj)-μC(xj)|+|vB(xj)-vC(xj)|+|πA(xj)-πB(xj)|≤

|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|

故SN2(A,C)≤SN2(B,C)。

3.3 加权正弦相似度测量公式的定义

加权正弦相似度测量公式定义如下:

μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-

(9)

μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-

(10)

当论域X中的每一个元素的权重相同时,即wj=1/n,j=1,2,…,n,公式(9)和公式(10)就转化为公式(7)和公式(8)。上述两个加权正弦相似度测量公式满足定义2中的四个条件,证明过程与3.2节相同。

4 直觉模糊集三角相似度测量公式比较

本节将通过几组数值例子来对本文提出的正弦相似度测量公式与文献[11-13]中的相似度测量公式进行比较,通过对测量结果进行分析比较来说明本文所提出的相似度测量公式的有效性和合理性。直觉模糊集A和B之间的相似度测量值如表1所示。

从表1中三角相似度测量的结果可以看出,文献[11]中的余弦相似度测量公式C1(A,B)在第2组和第3组例子之间进行相似度测量计算中出现

Table 1 Values of similarity measure between IFSs A and B

分母为零(无意义)现象,在第1组和第5组例子之间进行相似度测量计算中出现不合理现象。文献[13]中的公式CT1(A,B)在第1组和第6组例子之间相似度测量结果相同而出现无法区分现象。因此,上述现象将会给决策者在进行决策时带来不便。公式C2(A,B)、SN1(A,B)和SN2(A,B)在表1中具有较强的区分能力,但公式C2(A,B)计算过程相对复杂,相比之下公式SN1(A,B)和SN2(A,B)在实际应用中更具有优越性。

5 公式应用

(1)医疗诊断。

现有诊断集合P={P1,P2,P3,P4}分别表示病毒性发烧、感冒、疟疾和胃病问题。症状集合X={x1(发烧),x2(头痛),x3(胃疼),x4(咳嗽)}。经专家研究,得到如表2所示数据。

Table 2 Standard data of the four symptoms

现有一个病人,其症状的诊断结果Q为未知。设w={0.2,0.3,0.4,0.1}为症状集合中四个属性的权重集。现用本文提出的加权正弦相似度公式进行相应诊断,并与文献[11-13]中提出的相似度公式的诊断结果进行对比,得到如表3所示结果。

Table 3 Diagnosed results of differentsimilarity measure methods

分析表3中的数据可知,对于加权余弦相似度公式WC1,W(P1,Q)=W(P2,Q)=0.9910>W(P4,Q)=0.9216>W(P3,Q)=0.9163,出现了两个诊断结果的数值相等并且都是最大值,导致很难将诊断结果归类到P1(病毒性发烧)还是P2(感冒)。而加权相似度公式WCT在进行病人诊断结果识别时也出现了同样情况,而使用相似度公式WC2和本文提出的加权正弦相似度公式WSN1和WSN2则能够有效地区分,并把诊断结果Q归类到P2,即病人患的疾病是感冒。但是,相似度公式WC2计算过程相对复杂,所以本文提出的加权正弦相似度公式在实际应用中更具有优越性。

(2)决策应用。

本节将正弦相似度测量方法用于汽车发动机设计的备选方案选择决策例子中,通过实验的结果来表明所提出的相似度测量公式的合理性。

在汽车发动机设计的初期,设计师提出了一组备选方案A={A1,A2,A3,A4},分别代表柴油发动机、汽油发动机、纯电力电动机和混合动力发动机。设计师对以上四种设计方案都是从属性集X={x1,x2,x3,x4}来比较,x1:制造成本,x2:能源利用效率,x3:构造合理性,x4:制造难易程度。为了评价备选方案的优劣,专家给出了人们期望的设计方案A*,方案中的数据由专家给出。四种备选方案在属性集X上用直觉模糊集模型分别表示如下:

A1={〈x1,0.9,0.1〉,〈x2,0.88,0.05〉,〈x3,0.9,0.1〉,〈x4,0.5,0.2〉}

A2={〈x1,0.9,0.1〉,〈x2,0.83,0.0〉,〈x3,0.65,0.1〉,〈x4,0.6,0.1〉}

A3={〈x1,0.6,0.1〉,〈x2,0.45,0.3〉,〈x3,0.6,0.1〉,〈x4,0.5,0.2〉}

A4={〈x1,0.5,0.2〉,〈x2,0.6,0.15〉,〈x3,0.55,0.2〉,〈x4,0.9,0.1〉}

A*={〈x1,0.8,0.0〉,〈x2,0.8,0.0〉,〈x3,0.8,0.0〉,〈x4,0.8,0.0〉}

设w={0.1,0.25,0.25,0.4}为四个属性的权重集,在此用本文提出的公式(9)与公式(10)和公式(4)~公式(6)来计算备选方案和专家给出的期望设计方案之间的相似测量值,其相似度测量结果如表4所示。从相似度测量结果的排列顺序可以看出A2是最佳设计方案。

6 结束语

目前已有许多基于直觉模糊集相似度测量公式被提出,但现有部分公式在处理某些特殊情况时会出现不合理现象和计算过程相对复杂问题,实际运用效果较差。本文通过考虑隶属度、非隶属和犹豫度三方面的信息,首次提出两种基于正弦函数的相似度测量公式,证明了其正确性,并通过与其它相似度计算公式进行比较,表明了其优越性。

Table 4 Values of similarity measure betweenIFSs A and A* and ranking orders

[1] Zaded L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.

[2] Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.

[3] Gau W L,Buehrer D J.Vague sets[J].IEEE Transations on Systems,Man, and Cybernetics,1993,23(2):610-614.

[4] Bustince H,Burillo P.Vague sets are intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1996,79(3):403-405.

[5] Ye J.Similarity measures of intuitionistic fuzzy sets based on cosine function for the decision making of mechanical design schemes[J].Journal of Intelligent & Fuzzy Systems,2015,30(1):151-158.

[6] Chu Jun-feng,Wang Ying-ming.Method of pattern recogintion based on new similarity measure of interval-valued intuitionstic fuzzy set[J].Computer Engineering and Applications,2013,49(9):140-143.(in Chinese)

[7] Szmidt E,Kacprzyk J A.Similarity measure for intuitionistic fuzzy sets and its application in supporting medical diagnostic reasoning[J].Artificial Intelligence and Soft Computing,2004,3070(1):388-393.

[8] Chen S M. Measures of similarity between vague sets[J].Fuzzy Sets and Systems,1995,74(2):217-223.

[9] Hong D H, Kim C.A note on similarity measures between vague sets and between elements [J].Information Sciences,1999,115(1-4):83-96.

[10] Li D,Cheng C.New similarity measures of intuition fuzzy ses and application to pattern recoginition[J].Pattern Recognition Letters,2002,23(1-3):221-225.

[11] Ye J.Cosine similarity measure for intuitionsitc fuzzy sets and their applications[J].Mathematical and Computer Modelling,2011,53(1-2):91-97.

[12] Shi L L,Ye J.Study on fault diagnosis of turbine using an improved cosine similarity measure for vague sets[J].Journal of Applied Sciences,2013,13(10):1781-1786.

[13] Tian M Y.A new fuzzy similarity based on cotangent function for medical diagnosis[J].Advanced Modeling and Optimization,2013,15(2):1781-186.

附中文参考文献:

[6] 楚俊峰,王应明.基于新的区间直觉模糊集相似性测度的模式识别[J].计算机工程与应用,2013,49(9):140-143.

猜你喜欢

论域模糊集余弦
着舰指挥官非对称变论域模糊引导技术
基于四种截集的粗糙模糊集表现定理的新表示
基于上下截集的粗糙模糊集的运算性质
基于变论域模糊控制的Taylor逼近型内模PID算法
复图片模糊集及其在信号处理中的应用
区间直觉模糊集相似度构造
两个含余弦函数的三角母不等式及其推论
实施正、余弦函数代换破解一类代数问题
大众文化视域下流行音乐的论域、对象与定义
分数阶余弦变换的卷积定理