APP下载

一般多粒度量化软粗糙集模型

2021-06-23刘玉锋孙文鑫

计算机工程与应用 2021年12期
关键词:粗糙集刻画粒度

刘玉锋,孙文鑫

1.重庆城市科技学院,重庆402160

2.重庆水利电力职业技术学院,重庆402160

粗糙集[1]是一种用来进行数据挖掘和规则提取的数学工具。它在数据信息的处理中有独到的方法和手段,能准确地刻画对象。目前,粗糙集的研究主要体现在模型的应用和推广中[2-3]。例如:有些将等价划分中的粗糙集推广到区间值信息系统、序信息系统等[3-5];有些将粗糙集和其他理论相结合建立了新的粗糙集模型[6-10];有些将单论域的粗糙集推广到双论域中[11-13]。

多粒度粗糙集[14]是粗糙集的一种推广,它最早由Qian在2010年提出。它是运用粒计算的知识将单个关系划分的类看成一个粒,进而定义由多个关系划分(多个粒)时的粗糙集上下近似算子。近年来,多粒度粗糙集理论的研究成果也是硕果累累[15-20]。

软粗糙集模型是粗糙集模型的一种推广,软下近似是建立在函数F(a)完全包含于被刻画概念X中的。近几年,软粗糙集模型的推广也有很多成果[21-28],比如:多粒度软粗糙集和程度多粒度软粗糙集模型等[29-30]。其中,乐观多粒度软粗糙集的下近似要求至少存在一个粒满足函数F(a)完全包含于被刻画概念X中,悲观多粒度软粗糙集的下近似则要求所有粒满足函数F(a)完全包含于被刻画概念X中,程度多粒度软粗糙集的下近似要求部分满足函数F(a)完全包含于被刻画概念X中,这些模型的下近似定义都是建立在函数F(a)完全包含于被刻画概念X中的。在实际应用中,数据误差对概念刻画会产生误差,不能完全正确地描述概念,从而降低上述模型在实际应用中的适应性。

为了解决此类问题,本文通过定义含参数α的计数函数构建一种具有知识容错能力,能够适应带有数据误差情形的一般多粒度量化软粗糙集模型,并讨论了一般多粒度量化软粗糙的度量及其性质。最后,通过案例进行分析和说明。

1 预备知识

定义1[31]设非空集U、E,对于任意的A⊆E,如果存在集值映射F:A→P(U),则称S=(F,A)为U上的软集。

注意:对于任意的a∈A,在S=(F,A)中,F(a)可能为空集。

定义2[23]设S=(F,E)是U上的软集,A⊆E,那么P=(U,S)称为软近似空间。对于任意的集合X⊆U,定义软下、上近似分别为:

定义3[29]设S=(F,E)是U上的软集,(F,A i)(i=1,2,…,m)是论域U中的软子集(A i⊆E)。对于任意的X⊆U,定义乐观多粒度软下近似和上近似分别为:

定义悲观多粒度软下近似和上近似分别为:

文献[30]研究了多粒度软粗糙集模型下近似的结构,在此基础上考虑粒度的选取,进而提出了程度多粒度软粗糙集模型,并将多粒度软粗糙集模型下近似统一到程度多粒度软粗糙集模型中。

定义4[30]设S=(F,E)是U上的软集,其中(F,A i)(i=1,2,…,m)为U上的m个不同软集(A i⊆E),对于任意X⊆U,x⊆U,则定义元素x在属性A i下关于X的计数函数

定义5[30]设S=(F,E)是U上的软集,其中(F,A i)(i=1,2,…,m)是U上的m个不同软集(A i⊆E),对于任意的集合X⊆U,β∈(0,1],定义程度多粒度软下、上近似分别为:

2 一般多粒度量化软粗糙集模型

程度多粒度粗糙集模型中下近似考虑了在一定数目粒度下“∃a∈A i,x∈F(a)且F(a)⊆X”,在实际应用中不一定完全满足F(a)⊆X,需要具备一定容错能力的粗糙集模型,为解决此类问题,下面通过量化F(a)与X间的包含程度引入计数函数,构建了一种量化软粗糙集模型。

定义6设S=(F,E)是U上的软集,其中(F,A i)(i=1,2,…,m)是U上的m个不同软集(A i⊆E),对于任意的集合X⊆U,参数α∈(0,1],且F(a)≠∅时,记

性质1设S=(F,E)是U上的软集,其中(F,A i)(i=1,2,…,m)为U上的m个不同软集(A i⊆E),对于任意的集合X、Y⊆U,参数α,λ∈(0,1],且F(a)≠∅时,则量化计数函数有以下性质成立:

(2)如果X⊆Y,则

(5)如果α≤λ,则有,特别的,当λ=1时,

证明下面依次给出以上性质的证明过程。

(1)对任意的x⊆U,假设,则存在a∈矛盾,因此

定义7设S=(F,E)是U上的一个软集,(F,A i)(i=1,2,…,m)是论域U上的m个不同的软集(A i⊆A),对于任意的X⊆U,α,β∈(0,1],定义一般多粒度量化软下、上近似分别为:

根据一般多粒度量化软粗糙集的定义,可以得到其正域、负域、下边界域,上边界域分别为:

根据一般多粒度量化软粗糙集的定义,有下面性质成立。

性质2设S=(F,E)是U上的一个软集,(F,A i)(i=1,2,…,m)是U上的m个不同软集,对于任意的集合X,Y⊆U,α,β∈(0,1],则有以下性质成立:

证明接下来,依次给出以上性质的证明过程。

(7)根据性质(3)和性质(5)可得。

(8)根据性质(4)和性质(6)可得。

定义8[23]设S=(F,E)是U上的软集,如果则称S是U上的满软集。

性质3设S=(F,E)是U上的满软集,(F,A i)(i=1,2,…,m)是U上的m个不同满软集A i⊆E,对于任意的集合X,Y⊆U,参数α,β,λ∈(0,1],则有以下性质成立:

3 一般多粒度量化软粗糙集不确定性度量

不确定性度量是粗糙集中的重要部分,下面讨论一般多粒度量化软粗糙集的不确定性度量。

定义9设S=(F,E)是U上的一个软集,(F,A i)(i=1,2,…,m)是U上的m个不同软子集,对于任意的集合X⊆U,α,β∈(0,1],定义一般多粒度量化软粗糙集的精确度和粗糙度为:

由一般多粒度量化软粗糙集精确度和粗糙度的定义可以得到以下性质成立。

定理5设S=(F,E)是U上的一个软集,(F,A i)(i=1,2,…,m)是U上的m个不同软子集,对于任意的集合X⊆U,α,β,λ∈(0,1],如果α≤λ,有:

4 案例分析

随着环境的改变,各种传染病如SARS病毒、新型冠状病毒等通过各种渠道侵犯着人们的身体。为了避免交叉感染,各地各单位都采取了隔离等措施,然而如何将感染的人群隔离开成了一个关键问题。有些病人已经感染病毒,却无法得到确诊。这给医护人员的工作开展带来了很大的困扰。无法确诊的疑似感染人员也给自身和社会带来了巨大的恐慌。被感染的患者大都有以下症状:发热、头痛、呼吸困难、恶心、干咳、鼻塞、四肢无力、畏寒等记为V={a1,a2,…,a8}。在某城市有一批人疑似感染病毒的群体设为U={x1,x2,…,x10},这些人中多少有感染的症状具体观察记录情况见表1。经过一段时间的观察他们中某些人被确诊为感染了病毒设为X={x4,x5,x7,x9,x10}。现一批来自不同地方的专家进行联合会诊,一批针对发热、头痛、鼻塞症状A1={a1,a2,a6}人群进行会诊,一批针对呼吸困难、恶心、干咳症状A2={a3,a4,a5}人群进行会诊,一批针对发热、四肢无力、畏寒症状A3={a1,a7,a8}人群进行会诊。根据表1可得:

表1 某城市疑似感染病毒群体症状记录表

在α=0.6,时,由参数α量化计数函数计算得表2,再根据一般多粒度量化软粗糙集模型可以计算得:

表2 疑似感染病毒群体的症状在α=0.6时的计数函数

根据一般多粒度量化软粗糙集下、上近似算子的计算结果可以看出,患者x5,x7,x9,x10是确诊病人中病情比较严重的;患者x4虽然被确诊但是有望康复的概率是很大的;患者x2虽未确诊但染病的概率极大;患者x1,x3,x6,x8未确诊但有染病的风险;患者x1,x3,x8被感染的可能较低,应该分开隔离以避免交叉感染(此处α和β取值可以根据不同地区感染的严重程度和医院的情况设置)。根据上述分析,在传染病盛行的时候,患者人群最好分四类进行观察管理,这样有助于将患者进行分区观察,也能很好地分配医护人员,有助于医护人员工作的开展。

在α=0.8,时,由参数α量化计数函数计算得表3,再据一般多粒度量化软粗糙集模型可以计算得:

表3 疑似感染病毒群体的症状在α=0.8时的计数函数

由上述结果可知,下近似随着α增大而增大,上近似随着α增大而减少。在实际应用中应该根据对疾病的掌握情况适当地设置α取值,以防止因数据误差而导致诊断失误,从而加大传染病传播的可能性。因此一般多粒度量化软粗糙集模型的数据分析方法更具有实际意义,它在决策过程中能够解决因数据误差可能带来的决策失误。

5 结论

软粗糙集理论的研究已近成为当今学术界热门的研究课题之一。本文通过定义α计数函数将多粒度软粗糙集和量化粗糙集结合起来建立了一般多粒度量化软粗糙集。此外,为了突出模型的优势和劣势,定义了一般多粒度量化软粗糙集的精确度和粗糙度。一般多粒度量化软粗糙集模型的建立完善了多粒度软粗糙集理论,为软粗糙集的数据挖掘和规则提取奠定了理论基础。

猜你喜欢

粗糙集刻画粒度
粉末粒度对纯Re坯显微组织与力学性能的影响
基于Pawlak粗糙集模型的集合运算关系
刻画细节,展现关爱
基于粒度矩阵的程度多粒度粗糙集粒度约简
多粒化粗糙集性质的几个充分条件
双粒度混合烧结矿颗粒填充床压降实验
双论域粗糙集在故障诊断中的应用
泉州湾表层沉积物粒度特征分析
两个域上的覆盖变精度粗糙集模型
ℬ(ℋ)上在某点处左可导映射的刻画