APP下载

基于云模型的定性评价方法

2014-06-23张莉陈昊

湖北大学学报(自然科学版) 2014年4期
关键词:云滴正态定性

张莉,陈昊

(1.湖北大学知行学院,湖北 武汉430011;2.湖北大学计算机与信息工程学院,湖北 武汉430062)

定量分析和定性分析是两种最常见的评价事物的方法.前者主要用数学语言描述,依据统计数据,建立相应的数学模型,并用数学模型计算出分析对象的各项指标及其数值;后者主要用自然语言描述,是利用决策者的经验对评价对象的状态、行为及相关信息进行细致的观察和分析,直接给出其水平等级等定性结论的方法.定量评价虽然具有客观化、标准化和精确化的特征,但是人脑的思维基本上不是纯数学的,自然语言才是思维的载体,因此基于自然语言的定性评价在人类活动中有着更广泛的应用.

现有的定性分析方法不足之处主要表现在缺乏客观的定量分析以及对定量数据硬性划分.定性分析与评价涉及用自然语言描述定性概念,而自然语言中概念具有不确定性,主要体现在模糊性和随机性.为了使得定性评价更加科学准确,现代定性评价方法在定量数据基础上,建立了从数据到概念的转换模型,即定量表示的数值与定性描述的基本语言值之间的不确定转换模型.云模型是进行定量性转换的有效工具[1],李德毅院士提出的云模型能描述自然语言中概念的随机性、模糊性及其关联性[2].云模型通过正向云发生器和逆向云发生器实现定性概念与其定量数值之间的相互转换[3].正向云发生器是从定性到定量的映射,实现了定性概念的定量数据的范围和分布规律.而逆向云发生器则恰恰相反,是实现从定量值到定性概念的转换模型,将一定数量的精确数值有效转化为恰当的定性概念,因此逆向云发生器算法能有效的应用于各种定性评价.

1 云模型

1.1 云模型定义 概念是人脑的高级产物,是客体在人脑中的反映,自然语言中的概念是定性的,而且具有不确定性.定性概念的不确定性主要体现在概念的随机性和模糊性,云模型是在概率论和模糊集合论两种理论基础上,通过特定构造算法,统一刻画概念的随机性、模糊性及其关联性.设C是论域U上的概念,若x∈U是概念C的一次随机实现,x对C的确定度μ(x)∈[0,1]是有稳定倾向的随机数:μ(x):U→[0,1]∀x∈U,则x在论域U 上的分布称为云模型[4].

云模型的数字特征用期望Ex、熵En、超熵He 3个数值表示,它把概念的模糊性和随机性关联在一起,反映了定性概念整体特征.期望Ex是论域空间中最能代表这个定性概念的数值,熵En反映了在论域中可被概念接受的数域范围,是定性概念亦此亦彼性的度量,即模糊性.通常熵越大,表示定性概念的可度量粒度越大,概念越宏观.超熵He是熵不确定性的度量,它代表了定性概念的样本出现的随机性,通常超熵越大,云滴离散程度也越大,确定度的随机性也越大.

正态云是一种最基本的云模型,具有普遍适用性[5].正态云的期望曲线是一条正态曲线.正态云的正向云发生器是从概念表达的定性信息中获取定量数据的范围和分布情况,一维正态云实现算法如下:

输入:一维定性概念的数字特征(Ex,En,He)及云滴数N.

输出:N个云滴的定量值x以及代表概念的确定度y.

1)生成以En为期望值、He为均方差的正态随机数En′;

2)生成以Ex为期望值、En′为均方差的正态随机数x;

4)(x,y)成为论域中1个云滴;

5)重复步骤1)~4)直至产生N个云滴.

图1 一维正态云及期望曲线

例如用云模型表示定性概念“青年人”,根据生活经验,将20岁定为完全属于青年人概念即期望Ex,熵En和超熵He可以定为5和0.3,图1是用正向云发生器算法生成的青年人云.云的整体形状反映了定性概念的基本特征,云的厚度表现为中间分散,说明了距离概念中心不近不远的位置随机性大,体现了人们对此区间的年龄是否属于青年人的认识差异较大;两头凝聚,说明靠近概念中心或远离概念中心位置随机性小,体现人们对此区间的年龄是否属于青年人的主观认识差异小.图1中的曲线表示的是云模型的期望曲线,所有云滴都在期望曲线附近随机波动,波动程度是由超熵He控制,单个云滴并不影响云的整体形状[6-7].

在一维正态云模型基础上,很容易推广到二维乃至多维正态云[8],从而表示两个或者多个定性概念组合而成的复杂定性概念.比如通常用“身高、体重”两个指标评价儿童身体发育状况,以儿童身高和体重的期望Ex,熵En和超熵He为数字特征利用二维正态云发生器算法就能得到儿童身体发育状态云.

1.2 逆向云算法 逆向云发生器是将一定数量的精确数据转换为以数字特征期望Ex,熵En和超熵He表示的定性概念,从而实现了定量数据到定性概念的转换.文献[9]中提出一种基于确定度信息的逆向云拟合算法,该算法不仅需要云滴的定量值,而且还需要每个云滴的确定度信息,而在实际应用中,往往只有一组表示某个概念的定量值,难以获得概念的确定度信息,因此基于确定度信息的逆向云算法具有很大局限性.文献[10]中根据云的统计特征,仅利用云滴的定量值还原云表示概念的数字特征,算法简单,实用性强,易于推广到高维逆向云算法.由于该算法是基于统计原理的,实际计算过程中不同的云滴样本会导致相应的计算误差,尤其在计算超熵He过程中,如果云滴样本的S2-E^n2<0,则计算得到超熵值为虚数,如果超熵为虚数,则意味着本次计算失败,需要选择新的云滴样本从新计算.我们对算法做了改进,保证任何云滴样本输入计算得到的超熵值都是正实数,减小了计算误差.算法具体步骤如下:

输入:N 个云滴样本的定量值xi(i=1,…,N).

输出:云滴样本表示的定性概念的数字特征(Ex,En,He)的估计值.

1)根据N个云滴定量值xi计算样本均值

2 正态云定性分析方法

通常,人们更习惯于用自然语言而不是用精确的数值对事物进行分析和评价.正态逆向云能将一定数量的精确数值有效转化为用3个数字特征描述的定性概念,概念提升操作可以将用数字特征表示的原子概念组合成粗粒度的综合概念,从而能在粗细不同的粒度对事物的本质进行定性分析.利用正态云模型对客观事物进行定性分析与评价的具体步骤如下:

1)将实际的若干定量数值作为一个个云滴,且根据实际应用场合划分为若干相互独立的云滴团;

2)针对每个云滴团采用逆向云算法提取出一系列由正态云的3个数字特征表示的基本原子概念;

3)采用正态云概念提升策略,将细粒度的概念爬升到粗粒度概念,构造一个泛概念树结构.

以下采用二维正态云方法定性分析儿童健康发育状况,通过两个实际应用进一步解释正态云定性分析与评价方法.

3 儿童健康发育状况定性分析

通常用体重和身高两项指标评价儿童健康发育状况.目前传统的评价方法一般是对各个地区按年龄对儿童的体重和身高采样,然后求体重和身高样本值的均值,通过体重平均值和身高平均值衡量地区的儿童发育情况.这种评价方法显得粗糙简单,可以通过二维正态云评价方法分析儿童的健康状况.

每个儿童的体重和身高信息可以看作是一个二维的云滴,则某个地区的若干儿童的体重和身高采样信息是一个二维云滴团.将二维云滴团作为输入,首先通过二维正态逆向云算法得到反映整个云滴团的3个数字特征,3个数字特征相对一个均值更能全面评价某个地区的儿童发育情况.多个地区的数字特征可看成若干个由二维正态云描述的原子概念,通过概念提升操作可以得到全局的儿童发育情况.

以少量的实际数据为基础,通过产生随机数的方法生成大量模拟数据,验证二维逆向云算法和概念提升思想在儿童身体发育状况定性评价中的应用.儿童体重和身高采样信息源于华南、华中和华北3个地区,表1为部分采样数据.

利用二维正态逆向云算法可以计算出每个地区儿童的体重和身高的特征参数(Ex,En,He),从而能得到每个地区儿童身体发育状况的评价结果,体重和身高的期望Ex最能表现该地区儿童发育状况的整体水平,熵En和超熵He反映地区内儿童发育不平衡性,如表2所示.

表2 地区儿童发育状况数字特征

根据二维正态逆向云求出每个地区的儿童体重和身高发育状况的特征参数后,再通过二维正态正向云发生器就可以得到如图2所示的3个地区儿童生长发育状况的云图.从中可以看出华南地区儿童体型偏小,华北地区儿童体型较大,华中地区介于二者之间,华中地区内部儿童的发育情况较华南和华北地区相对平衡.

图2 地区儿童发育状况正态云图

图3 全国儿童身体发育水平正态云图

将二维正态逆向云算法得到的3个地区儿童发育状况的数字特征作为关联的3个原子概念,通过二维正态云概念提升操作,生成更高层次的复合概念,反映全国儿童的生长发育水平.根据每个地区儿童发育状况的实际物理意义,可利用基于逻辑运算的概念组合法得到全国儿童的生长发育水平,如表3所示.通过二维正态正向云发生器算法就可以得到如图3所示的全国儿童的生长发育水平云图.

表3 全国儿童身体发育评价结果

4 小结

正态逆向云能有效实现从定量数值到定性概念的自然转化,用3个数字特征有效表示定性概念.给定若干实际一维或高维的定量数值,利用正态逆向云算法可能得到一系列用数字特征表示的一维或高维的原子定性概念.利用基于逻辑运算或算术运算的概念提升操作可以将原子概念组合成粗粒度的综合概念,从整体上把握事物的本质特征.通过儿童身体发育水平评价实例,验证了将正态逆向云和概念提升两种方法相结合进行定性评价的实用性和有效性,与传统的定性评价方法相比较,基于云模型的定性评价方法实用性强,而且评价结果全面深刻.

[1]冯向荣,吴俊.基于模型的支持向量机的入侵检测特征选择方法[J].华中师范大学学报:自然科学版,2013,47(1):23-26.

[2]李德毅.知识表示中的不确定性[J].中国工程科学,2000,2(10):73-79.

[3]李德毅,杜鹢.不确定性人工智能[M].北京:国防工业出版社,2005.

[4]李德毅,孟海军,史学梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20.

[5]李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-33.

[6]刘常昱,李德毅,杜鹢,等.正态云模型的统计分析[J].信息与控制,2005,34(2):236-239.

[7]罗自强,张光卫,李德毅.一维正态云的概率统计分析[J].信息与控制,2007,36(4):471-475.

[8]杨朝晖,李德毅.二维云模型及其在预测中的应用[J].计算学报,1998,21(11):961-969.

[9]吕辉军,王晔,李德毅,等.逆向云在定性评价中的应用[J].计算机学报,2003,26(8):1009-1014.

[10]刘常昱,冯芒,戴晓军,等.基于云 X信息的逆向云新算法[J].系统仿真学报,2004,16(11):2417-2420.

猜你喜欢

云滴正态定性
分裂平衡问题的Levitin-Polyak适定性
福建九仙山一次佛光的云滴粒子尺度分析*
利用二元对数正态丰度模型预测铀资源总量
你不知道的雷雨知识
当归和欧当归的定性与定量鉴别
双幂变换下正态线性回归模型参数的假设检验
基于泛正态阻抗云的谐波发射水平估计
云微物理特性及云滴有效半径参数化:一次降水层状云的飞机观测资料结果
半参数EV模型二阶段估计的渐近正态性
云滴谱离散度对气溶胶间接效应影响的研究进展