APP下载

基于支持向量机(SVM)算法的加工机械故障分析

2021-10-20梁毅峰

辽东学院学报(自然科学版) 2021年3期
关键词:超平面机械故障向量

梁毅峰

(淮北职业技术学院 机电工程系,安徽 淮北 235000)

工业是国民经济的基础产业之一,关系到国计民生。随着机械加工技术及制造水平的提高及精加工需求总量的不断攀升,加工产业的机械化、自动化程度也在持续提高[1-2]。大型机械化加工企业为了提高生产效率,多采用流水生产线,加工机械出现了大型化、复杂化的发展趋势[3],但同时也增加了机械设备出现故障的概率。与其他类别的产品生产加工不同,加工机械对于温度、压力、加工时间等指标的要求更为严格,如果加工机械因出现故障,导致不合格产品流入市场,就会严重影响消费者的身心健康。预防出现因设备故障而导致的大规模加工质量问题,最好的方法是对加工生产线、设备等实施在线监控[4-5],一旦出现异常就可以及时预警并处理,避免出现更大损失。就设备在线监控而言,目前主要有基于无线传感器的动态测试技术[6]和以小波变换技术为代表的信号处理技术[7-8],这两种方案都是较为成熟的在线监控方法,但随着设备复杂程度的提高,监控故障数据总量增加,对故障信号识别与处理的精度会不断下降,并不能完全排除故障风险。近些年,人工智能[9]和机器学习[10]技术得到了空前的发展,二者在处理海量故障数据、故障特征分类与提取的过程中具有传统方法无法比拟的优势。为更加准确地定位机械故障位置,确定设备的故障类别,并提取出加工机械的故障特征,本文提出一种基于智能支持向量机(SVM)算法的故障分析方案,以提高加工机械故障在线分类与特征提取的精度,及时排除运转中设备的故障。

1 SVM算法分类原理及其性能优化

生产加工生产线设计通常为复杂的流水线,个别设备的机械故障容易导致整条生产线停机。在线机械故障检测所面对的主要难题是海量的原始故障信号源与复杂的噪声干扰,在较短的时间内剔除噪声干扰、提取故障特征并对故障特征进行准确分类的难度极大。机器学习和深度学习是在线处理海量数据与提取故障信号特征的有效方法,SVM是人工智能与机器学习技术的基本算法之一。作为一种非线性的数据处理模式,SVM算法具有强大的数据处理能力和泛化性能,尤其适用于复杂故障样本和高维数据样本的分类与寻优求解。拓展到三维内积空间T,用户故障特征分类的超平面表示为

{(η·xi)+ζ=0|xi∈T,η∈T,ζ},

(1)

其中:xi为故障数据点;向量η为决定数据点xi到超平面的距离系数,与SVM超平面垂直;ζ是R集范围内的实数。η参数和ζ决定超平面的曲率。

为了避免模型参数乘以非零常数造成平面不变,对经典SVM算法进行深度优化。引入规范化超平面的概念,即用不同的参数来限定超平面。规范化超平面可以表示为

{(η·x)+ζ=0|x∈T,(η,ζ)∈T×R}。

(2)

式(2)中设定规范化超平面是相对于故障数据点集X={x1,x2,…,xn}的超平面,满足条件X∈T。在最优解条件限定下,规范化超平面满足条件:

(3)

S={(xi,yi)|xi∈T,yi∈[-1,1]}。

(4)

受规范平面的限制,纵坐标值yi被限定在[-1,1]之间,此时用于确定故障点到分类超平面距离的分类几何间隔τη,ζ为

(5)

在确定不同机械故障类别数据点时,全部测试点都被认为具有较小扰动,如果用几何间隔τη,ζ划分训练集合,那么依据规范化超平面的最优限定条件,就能够准确地分开两类故障。针对维数较高的非线性超平面划分问题,还需要在二维超平面分割的基础上对全部高维训练样本作内积运算,并旋转与高维数据相匹配的SVM模型核函数。核函数选择也是优化SVM算法的核心步骤之一。考虑到加工机械故障数据集的复杂程度及对故障检测精度要求较高,本文在SVM模型构建基础上选择高斯径向基函数作为算法模型核函数,即:

ζ(xi,yi)=exp{-κ|xi-yi|2}。

(6)

相对于其他类别的核函数,高斯径向基函数更适用于处理海量、复杂、高维的故障数据集,而经过优化后的SVM分类模型的规范化超平面具有更强的故障数据分类处理能力,有助于提升对多类别机械故障点的定位与诊断。

2 基于SVM算法的机械设备故障定位与诊断

2.1 故障数据集预处理与特征提取

由终端传感器采集到的加工机械的原始故障数据集不仅规模较大,而且包含大量系统噪声与环境噪声,含噪信号只有经过预处理才能准确提取故障特征和进行特征分类,流程如图1所示。

噪声信号与振动信号在物理频率及MEL频率上都存在差异,分帧降噪原理是通过对混合信号的预加重分帧加窗,滤除频率差异的噪声信号。对分帧后的振动信号进行傅里叶变换,改变原有故障信号的振动区间和振动频率。经过分帧降噪后的原始振动信号为x(t),经过傅里叶变换后原始振动信号的频率会产生变化,频域范围和振动频率改变后的信号为

(7)

基于MEL滤波器的二次处理振动信号,一方面滤除残余环境噪声的干扰,另一方面还能够达到故障数据降维的目的。复杂机械故障信号具有非线性和非平稳性特征,需要在时频域范围统计时域信号的稀疏表征,具体的特征类别包括峰值、峭度、波形因子、均方根值等。在针对去噪故障信号的特征提取方面,本文基于样本熵排列提取故障信号特征,去噪后的信号用1组时间序列表示:

{x′(t)}={x(1),x(2),…,x(m)}。

(8)

样本熵的提取过程如下:

(1)从第j个故障数据点开始提取连续的k个故障数据点构建向量Xk(1),…,Xk(m-k+1);

(2)计算向量Xk(i)和Xk(j)所对应元素的最大差值绝对值d[Xk(i),Xk(j)];

(3)在给定空间阈值δ范围内,计算向量Xk(i)中空间距离小于阈值范围δ的向量数量所占比例;

(4)将数据集的维数从m增加到m+1,分析序列中平均熵参数的变化趋势。

由于截取的故障点所构建的向量对非线性、非平稳信号有着更高敏感度,可以用一种更为清晰和简洁的方式反映出每一种故障信号的复杂冲击过程。在复杂的故障数据集系统中,每个故障向量都可能受到已知故障向量的影响,而在样本熵模式下基于每一种向量距离出现的概率比重确定向量的类别,能够更准确地得到故障数据集的复杂度特征。

2.2 基于优化SVM算法的设备故障分类

计算故障特征向量之间的相关性,以相关性取值概率大于0.85的变量作为目标特征向量,对得到特征数据进行归一化处理,纵坐标值yi的取值区间被限定在[0,1]之间,SVM模型构建及基于SVM算法模型的故障诊断与分析流程如图2所示。

选取与SVM模型规范超平面相关性概率大于0.85的特征值,组建新特征向量,在特征选取时就可以降低数据总体规模和数据集的高维特征。基于SVM算法的数据分类方案就是要找出输入控件与输出控件之间的映射关系,并在高维空间内实现对故障数据的分类及高阶线性回归。针对非线性数据集的特征选择问题,引入最优回归函数和惩罚因子来有效地规避经验风险值,回归函数r(t)为

(9)

其中,C为模型的惩罚因子。在模型回归函数的预估中,还要引入模型损失函数:

L(y,f(x,η))=(y-f(x,η))2。

(10)

在利用规范超平面的故障数据分类过程中,对于支持向量而言,所对应的拉格朗日乘子要满足不为零的先决条件,才能解决数据集的非线性回归问题。选用高斯径向基函数做高维替代的内积计算,实现对函数值的准确预估。SVM算法模型中的核心参数设定,包括惩罚因子C和高斯径向基参数κ,如果核心参数的取值过大则容易导致过学习,如果核心参数取值过小则容易导致欠学习,无论是过学习还是欠学习都会导致故障类别的分类精度降低。本文用交叉验证法对核心参数进行优化选择,将全部故障数据集以随机方式划分为M个子集,子集规模相近且互补相交,即全部子集的交集为空集,全部子集的并集为整个故障数据集。将划分完成的子集进行M训练与检验,从子集集合中选取第i次迭代的子集作为测试集,将其余子集作为训练集,一次检验之后复制上述方法交叉检验,使惩罚因子C和高斯径向基参数κ在全部数据集网格中得到遍历和验证,最终得到均方误差最低的1组参数值组合。

在线性可分空间范围内,SVM算法只需要找到1个超平面就可以对两类机械故障样本的最大间隔做出划分,在N维空间内规范化的超平面F(x)为

F(x)=(ηN·x)+ζ=0。

(11)

任意两个故障样本集支持向量到超平面的和是最大间隔的两倍,即满足条件为

(12)

考虑到分类过程中的故障类别数量远远高于两种,因此在样本集划分中应尽量减少误差值,如果当待检测故障样本呈现出线性分布特征时,则故障分类过程描述如图3所示。

当加工机械的故障样本呈现出非线性分布的特征时,需要将原有的非线性分布映射到高维线性可分空间,并求解出规范化的超平面。在线性不可分空间内的故障分类过程如图4所示。

故障数据训练中核函数主要负责将高维不可分空间的内积运算转换为低维核函数运算,降低算法复杂度,同时提高故障分类准确率。当涉及多分类场景时,需要先将多分类场景拆分为多个二分类场景,构造多个SVM分类器再进行组合,以便能够适应多分类场景需要。

3 实验仿真与实例应用

在实验室仿真环境下,借助旋转实验台模拟旋转类加工机械设备的工作状态,提取500组训练故障样本和20组测试数据,每组数据包括4种故障类型:不同轴、偏磨、断齿及齿面磨损。用Matlab仿真软件对原始故障代码进行数值模拟,所形成的20组故障测试集如表1和表2所示。

表1 1~10组测试故障集

表2 11~20组测试故障集

验证文中提出加工机械故障检测算法,在故障分类时的PBPA(概率赋值函数)指标值变化情况。PBPA可视为支持某一个变量θ子集的信念测度,定义为PBPA:→[0,1],且满足条件

(13)

信念测度归属度(BPA)指标值越高表明算法的数据融合性能越好,可以带来更高数据分类精度。BPA指标值的统计结果如图5所示。

统计结果显示,基于优化SVM算法控制下的BPA指标值平稳,未出现较大波动;而在其余两种分类算法[6-8]下,不仅平均BPA值更低,且从各测试集指标随机分布情况来看,稳定性较差,这表明在数据集规模较大及故障类别较多条件下,传统故障分析方案的数据融合效果较差,最终会导致故障分类精度降低。故障的分类结果如图6所示。

当测试集的数量规模由1增加到20时,各算法的分类精度指标都呈现出下降的趋势,但优化SVM控制算法的性能衰减较慢,当数据集的规模达到20时,故障分类精度仍能够保证在95%以上;而动态测试方法和信号处理方法,随着数据规模的增长性能衰减过快,当测试集的数据规模为20时,故障分类精度甚至低于了80%,故障分类精度将直接影响到最终的故障定位与检测精度。

为检测优化SVM故障检测算法在工厂的实际应用性能,以B市W企业的数控车床轴承偏磨故障为研究对象,进行跟踪检测与调查,测试周期为8周(2020年5月—6月),各周的检测结果统计如表3所示。

表3 车床轴承偏磨故障率结果统计

在8周统计期内,W企业的平均设备故障检测率水平达到98.06%,而该企业2019年的年均故障检测率为82.41%(数据来源于W企业的设备管理部门和财务部门)。由此可见,优化SVM算法分析具有良好的实际应用效果。

4 结语

人工智能、机器学习技术的发展与成熟,为机械故障检测提供了一条全新途径。加工企业对于设备稳定运行的要求越来越高,为此本文对经典SVM算法进行了深度优化,改善设备故障数据的分类性能和模型的泛化性能,在核函数选择与惩罚因子的赋值方面,采用交叉验证法提高模型参数的选择与匹配精度。仿真结果与实际应用结果都显示:基于优化SVM算法的分析方法在数据分类精度、故障检测精度方面均优于传统方法。

猜你喜欢

超平面机械故障向量
一种改进的多分类孪生支持向量机
向量的分解
基于非线性核的SVM模型可视化策略
汽车发动机机械故障的非接触式检测技术研究
有限维Banach空间中完备集的构造
聚焦“向量与三角”创新题
汽车机械故障成因及维修处理方式探讨
Gianluca Capannolo
汽车机械故障原因及诊断探究
向量垂直在解析几何中的应用