APP下载

基于模糊规则的土壤分类系统

2016-08-15吉林市北华大学信息技术与传媒学院吉林吉林132013

山东工业技术 2016年16期
关键词:测试数据规则分类

刘 颖(吉林市北华大学信息技术与传媒学院,吉林 吉林 132013)

基于模糊规则的土壤分类系统

刘 颖
(吉林市北华大学信息技术与传媒学院,吉林 吉林 132013)

模糊分类系统一直被用于表示一个集合的分类知识,系统中包含分类知识的可读规则和对规则的相关解释。本文讨论了如何构建模糊分类规则,以及如何使用模糊分类规则来生成目标土壤数据。在模糊分类系统设计中最重要的任务是从训练数据中找到一套模糊规则来处理一个特定的分类问题。在本文中,首先定义模糊系统隶属度函数,根据隶属度函数确定土壤数据的输入属性类别,然后在生成初始模糊规则集的基础上用函数计算土壤数据的属性,最后合并这些模糊规则,产生最终的模糊规则集。

模糊分类系统; 土壤分类; 隶属函数; 模糊规则

DOI:10.16640/j.cnki.37-1222/t.2016.16.173

0 引言

模糊分类系统被广泛认为是一个较好用来表示分类知识的分类系统,它具备可读性和可解释性的模糊规则库[1]。模糊分类系统可以将传统数据抽象为语言变量,利用模糊分类器,人们可以得到系统建议与结论。我们赖以生存的世界是模糊的,同时,绝对清晰的阈值是不存在的。因此,使用模糊规则显得尤为直观,指定模糊集有时比指定清晰的时间间隔更为容易[2]。模糊推理系统将“不知何故”处理的不确定性,在处理实际问题时要更为真实。模糊分类系统的模糊规则获取方法主要包括两种。一种是直接由专家直接给出;另一种是通过自主学习模糊分类系统自动产生的。近年来,越来越多学者将目光投向后一种方法,通过自主学习来产生模糊规则集解决问题实例。

近些年,土壤问题得到广泛学者的关注。在对土壤进行分类时,土壤特征具有重要的作用,土壤特征对土地利用和土地管理有着重要的意义。虽然在土壤分类过程中不可避免会丢失一些信息,但是土壤分类能有效地降低上述过程中数据信息的复杂度,这有助于我们了解土壤的主要特征。本文讨论了土壤分类方法,提出一种基于模糊规则的土壤分类方法,新方法在对土壤分类时可以减少信息丢失并能根据已有数据准确定位测试土壤的质地。在本文中,我们使用三角隶属函数的方法来定义隶属函数的输入属性,提出了一种新方法来产生模糊规则,利用一组测试数据对分类系统进行测试,测试结果验证了系统的有效性。

1 问题特征与隶属度函数

土壤数据包含111个实例,每个实例由7个输入属性和一个输出的属性组成。为了能够清楚地说明提出的模糊规则生成算法,我们选择了指定情况下,每种类型的土壤数据输出属性。

传统模糊分类系统中有许多类型的隶属度函数,最常用的隶属函数三角形隶属函数、梯形隶属函数、高斯钟形曲线隶属函数和S形隶属函数。在本文中,我们采用了三角形隶属函数来描述数据特征。我们假定每个输入属性标签的数量是4个,它们分别是:ZE, PL, PM,PH。输入的隶属度函数属性分别为:depth, Sand, Silt, Clay, Sandbysilt,Sandbyclay, Sandbysiltclay。

2 算法

本文利用一组训练数据,提出一种基于模糊规则的土壤分类系统算法。该算法分成四个步骤,详细步骤如下:

步骤1:将训练数据中的每个训练样本转换为一条模糊规则,然后将新生成模糊规则放入初始规则集。

步骤2:对初始规则集进行判断,如果初始规则集为空,或者所有的模糊规则集的初始规则都已被采取,则算法停止;否则从初始规则集中采取一条模糊规则。

步骤3:如果一组已被采取的模糊规则是空的或者存在部分模糊规则有相同的输出与特征,则合并模糊规则,即模糊规则的成员均不相同。否则进入步骤4。

步骤4:将模糊规则与具备模糊规则相同输出但是并没有被采取的模糊规则合并;如果被合并模糊规则与原模糊规则具备相同特征,则合并后的模糊规则将取代原规则,跳转至步骤2,否则转到步骤3。

根据上述四个步骤产生最终模糊规则集。接下来,用测试数据验证系统有效性。首先,我们导入测试数据,然后将测试数据生成系统标签,最后测试分类系统是否包含明确规则集的模糊规则。

3 仿真实验

在本节中,我们使用C++语言程序设计进行编程。首先定义隶属函数的输入属性,再将每个训练数据都转换成一个模糊规则,从初始训练数据中选择训练数据(91.4,6.85,1.75,13.34,3.91,10.62)。其中,属性深度值为0.17,我们映射值“0.17”为输入属性深度的隶属函数,并检查与标签的隶属关系,我们可以得到,它的隶属度值为1。用同样的方式,我们可以转换((91.4,6.85,1.75,13.34,3.91,0.17,10.62),1)为(({ZE}, {PH}, {ZE}, {ZE},{ZE}, {PH},{PL}), 1)。重复上述步骤,我们可以将初始训练数据转换为初始规则集:

接下来,我们用这些模糊规则来处理分类。我们使用的实例(37.15,0.73,18.25,44,2.07,0.41和0.6)的土壤数据作为测试数据来说明整个分类过程。首先,我们将这个测试数据进行转换,然后把这个转换的数据再转换成其相对的模糊规则,通过对比计算得出分类系统运算时间与分类准确率。

4 结论

本文提出了一种基于模糊规则的土壤分类系统,新算法首先将训练数据转换成初始的模糊规则集,然后根据顺序一个接一个合并那些最初产生的模糊规则,以减少模糊规则的数目。最后导入测试数据,验证系统有效性。新算法对以往算法进行了修改,与原算法不同的是,新算法接受输入属性,并生成最后的规则,消除了需要生成初始规则和合并的初始规则,也消除了特征相似度较大的初始规则,仿真实验表明该程序可以运行接受输入属性任意数量的数据,并能立即产生模糊规则的纹理类类型。虽然算法结果令人满意,但是如何能够简化算法的复杂程度,这将是本文下一步的工作。

[1]安红艳,龙怀玉,张认连,雷秋良,穆真.冀北山地5个土壤发生学分类代表性剖面在系统分类中的归属研究[J]. 河北农业大学学报, 2012(04).

[2]闫湘,常庆瑞,王晓强,潘靖平.陕西关中土垫旱耕人为土样区的基层分类研究[J].土壤学报,2005(04).

猜你喜欢

测试数据规则分类
基于ID3决策树算法的大学生体能测试数据管理系统设计
撑竿跳规则的制定
测试数据管理系统设计与实现
奥斯卡的规则变了!
让规则不规则
按需分类
教你一招:数的分类
说说分类那些事
TPP反腐败规则对我国的启示
基于自适应粒子群优化算法的测试数据扩增方法