APP下载

基于粗糙集与神经网络集成的制造过程质量诊断技术研究

2014-09-04江大伟1平2李丽华2

中国铸造装备与技术 2014年2期
关键词:决策表约简粗糙集

江大伟1,周 平2,李丽华2

(1.威高集团,山东威海 264300;2.济南铸造锻压机械研究所有限公司,山东济南 250022)

0 前言

机械制造质量诊断过程中,在保证质量诊断精度大致不变的情况下,如何尽可能减少特征维数,降低计算工作量和减少不确定性因素的影响,是一个亟待解决的问题。质量问题产生的机理不甚清楚,故障的表现形式不唯一,有时甚至是含糊的,在提取故障特征时也时常带有盲目性,从而导致了实际描述的质量问题不够分明。诊断推理是根据特定的映射关系由故障征兆域到故障原因域的计算求解问题,神经网络[1,2]具有强大的模式分类能力,在智能故障诊断中得到了广泛应用。但当神经网络规模较大、样本较多时,会含有大量冗余信息,导致网络学习复杂,训练时间过长。这些对神经网络的精度及泛化能力均会产生影响。粗糙集(RS,Rough Set)的知识约简有利于提高前者的学习能力,并能求出各影响因素的重要程度,而神经网络的良好抗噪性能可以很好地弥补后者的缺陷。因此,基于两者有机结合进行制造过程质量诊断研究对提高质量诊断效率及产品质量具有重要意义。

1 粗糙集理论与方法

粗糙集[3]是波兰科学家Pawlak Z于1982年提出的一种数据分析理论。这一理论无需任何附加信息或者先验知识就能有效地分析和处理不精确、不完整和不一致等各种不完备数据,从中发现隐藏的知识、揭示潜在的规律。

1.1 知识表达系统

知识表达系统在智能数据处理中占有十分重要的地位。形式上,四元组 S=(U,A,V,f)是一个知识表达系统。

U:对象的非空有限集合,称为论域;

A:属性的非空有限集合;

f:U×A→V是一个信息函数,它为每个对象的每个属性赋予一个信息值,即∀a∈A,x∈U,f(x,a)∈Va。

知识表达系统的数据以关系表的形式表示。关系表的行对应要研究的对象,列对应对象的属性,对象的信息是通过制定对象的各属性来表达。

决策表是一类特殊的重要的知识表达系统。

A=C∪D,C∩D=φ,C为条件属性集,D 为决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。

1.2 属性约简

一般约简算法,是一个穷尽搜索的过程,需要的时间复杂度很大,因此引入了可辨识矩阵的方法。

差别矩阵(Discernibility Matrix)也称可辨识矩阵,它在核的计算中有重要作用,该算法是由波兰华沙大学数学家Skowron于1992年提出的。

决策表S=f(U,R,V,f)(R=C∪D)的差别矩阵是一个对称的U×U矩阵,矩阵的每一项Cij表示为:

2 基于粗糙集—神经网络结合的工序质量诊断模型

为解决神经网络规模扩大、样本数量多过程中造成的产生学习复杂、训练时间长问题,利用粗糙集的约简来提高神经网络的学习能力,提高质量诊断效率和正确率。

图1 基于粗糙集-神经网络结合的工序质量诊断流程示意图

2.1 粗糙集数据预处理

离散化处理。粗糙集方法是一类符号化分析方法,所有的属性值均看作定性数据。若定量数据要和定性数据综合处理,则需将定量数据转换成定性数据。离散化处理方法很多,如等间隔划分法、等频率间隔划分法、基于条件信息墒的方法、L-方法、W-方法、P-方法和C-方法等。本文采用自组织神经网络方法,该网络模拟大脑神经系统自组织特征映射的功能。它是一种竞争型网络,采用无监督学习算法进行网络训练,此网络广泛应用于样本分类、排序和样本检测等方面。

2.2 建立决策表和属性约简

由离散化后的数据组成决策表,条件属性(离散化后的参数)和决策属性(参数所对应的故障类别)知识约简先删除决策表中冗余的行,然后利用分辨矩阵进行属性约简。

2.3 建立神经网络模型

前馈式神经网络是众多神经网络模型中应用最为广泛的网络之一,具有较强的模式分类能力。误差反向传播神经网络(BP网络[4])具有很强的生物背景,具有多输入多输出特性。建立神经网络模型的具体步骤为:首先将约简整理后的数据决策表作为神经网络的训练样本进行训练,并对故障类别进行编码作为网络的输出,获得各自的连接权值和阈值;然后存储相应的连接权值,形成知识库;最后用训练好的网络进行质量诊断[5]。本文采用最常用的3层网络结构的BP(Back Propagation)网络模型,该神经网络模型的学习算法采用Levenberg-Marquardt(批处理)的BP算法。

3 案例分析

以某机床厂高硬度轴(材料为42CrMo,淬火)磨削为例,说明基于粗糙集理论与BP神经网络集成质量诊断方法在该磨削工序中的应用,寻求影响表面粗糙度的因素,并且分析主因和次因,即求出各影响因素对粗糙度的影响程度大小。

该磨削工序为加工一批机床零件,该生产工序的质量决策表如表1所示。表中属性值是已经离散化处理的数值。

表1 42CrMo轴粗糙度原始决策表(完备)

由上述可区分矩阵可以看到有三个单元素,即该决策表的三个核,并且约简结果也是{C0,C1,C2}。

分别计算每个条件属性对决策属性的影响:

结果分析:最重要影响因素是工件转速,其次为分形维、进给量。所以在控制粗糙度时,重点控制工件转速、分形维和进给量就能保证加工产品的质量,提高质量诊断效率,降低诊断成本。

表2 轴粗糙度可区分矩阵

表3 待测试样本

表4 实验结果

从上表可看出神经网络学习步数缩短,单纯的神经网络和单纯的粗糙集诊断模型的准确率要比其集成低,原因在于神经网络在冗余属性多时会产生过配合的现象,粗糙集在于抗噪性差以及泛化能力差,导致诊断错误。两者集成使神经网络的训练步数缩短,且诊断正确率提高,是由于影响因素属性减少,因此大大提高了诊断效率。

4 总结

通过实验证明,基于粗糙集与神经网络质量诊断模型在制造过程质量诊断方面具有很好的适用性和可行性,该方法可以充分发挥各自的优势,粗糙集理论对知识进行约简,利用最终决策表建立的BP神经网络具有更好的拓扑结构,其学习速度、判断能力及容错能力都有很大的提高。实例诊断结果表明:利用此方法可大大提高诊断效率,降低诊断成本,可为解决现代工业工程中的质量诊断提供有效的参考。

[1]朱凯,王正林.精通MATLAB神经网络[M].北京:电子工业出版社,2010.

[2]张腾飞,王锡淮,叶银忠,肖健梅.粗糙集理论在故障诊断中的应用综述[J].上海海事大学学报,2005,26(4):20-24.

[3]张文修,吴伟志,梁吉业,李德玉.粗糙集理论与方法[M].北京:科学出版社,2008.

[4]李增亮,王庆楠,李成平.BP网络在液压驱动螺杆泵故障诊断中的应用[J].石油机械,2006,34(8)48-50.

[5]杨占玺,韩秋实.基于信息融合技术的加工过程监测系统研究[J].机械设计与制造,2009,9(8),243-244.

猜你喜欢

决策表约简粗糙集
粗糙集与包络分析下舰船运行数据聚类算法
基于决策表相容度和属性重要度的连续属性离散化算法*
基于混合增量式属性约简的中医甲状腺结节诊疗规律分析
基于Pawlak粗糙集模型的集合运算关系
带权决策表的变精度约简算法
近似边界精度信息熵的属性约简
广义分布保持属性约简研究
电力稳控系统在石化企业的应用
基于决策等价性的决策表属性集分解研究*
一种基于粗糙集理论的社交网络潜在路径研究