APP下载

基于GA-KELM 的复杂路面病害分割算法*

2022-06-02王青宁单钰强

电子器件 2022年1期
关键词:训练样本特征向量分类器

李 鹏 王青宁 单钰强

(1.南京信息工程大学,江苏省大气环境与装备技术协同创新中心,江苏 南京 210044;2.南京信息工程大学,江苏省气象探测与信息处理重点实验室,江苏 南京 210044;3.南京信息工程大学滨江学院,江苏 无锡 214105)

公路路面病害对行车安全有重大隐患,常见的路面病害有坑洼、裂缝、松散和车辙等。不同的病害类型关系到不同的危机程度。因此,路面病害检测对公路维护具有重大意义。

在国外研究中,Luo 等人[1]提出采用奇异值分解提取裂缝特征,在此基础上使用滑动窗口进行分割和识别。该方法适合狭窄的管道裂缝,但对宽视角的路面病害检测效果不尽人意。Banharnsakun[2]提出了将人工蜂群算法与人工神经网络相结合的路面裂缝检测与分类算法。该方法的分割精度与SVM 相比提高了近20%,但性能仍有进一步的改进空间。Zhang等人[3]提出一种基于卷积神经网络的高效算法用于三维沥青路面裂缝自动识别检测中。与近年发展起来的基于传统机器学习和成像算法的裂缝检测算法相比,CrackNet 在F 度量方面明显优于传统方法,但针对复杂路面情况时,分割效果有所下降。Noh Y等[4]采用模糊C 均值算法自动地对裂缝进行分割。最后通过形态学操作对裂缝进行精确分割。但该方法需要先有经验判断阈值,不具有良好的自适应性。

在国内研究中,李加州[5]提出了一种改进的极限学习机算法,该模型对极限学习机中随机给定的参数使用狮群算法进行优化以提高识别精度,并采用卷积神经网络对微小裂缝进行特征提取将其作为改进分类器的输入。但该方法只识别出裂缝类型并没有对裂缝进行检测。李鹏等人[6]提出一种改进的脉冲耦合神经网络的检测方法,通过简化脉冲耦合神经网络的模型来对关键参数自适应以及对神经元点火条件进行优化,但是在路面有杂物干扰的情况下,裂缝检测提取效果还不是很理想。陈晓东等人[7]提出了将Gabor 滤波器与卷积神经网络相结合的检测模型,提取裂缝图像的Gabor 纹理特征,来解决传统CNN 单一有效特征的学习,检测准确率有较高提升,但要需要大量训练样本。

路面病害情况复杂,往往出现多种病害相杂糅。如坑洼边缘连接着网状裂缝,网状裂缝旁常伴随着路面松散。上述方法对路面裂缝检测效果优良,但不适用于复杂病害的检测。为此,本文提出适应性较强的路面病害检测方法。采用二维Otsu 对病害图像进行像素点分类,选择合适的训练样本。提取图像的纹理特征以及边缘形状特征。由于图像数据量大,对提取后的特征向量进行降维,将得到的新特征作为特征属性对遗传算法改进的核极限学习机(Genetic Algorithm-Kernel Extreme Learning Machine,GA-KELM)进行训练产生分类器,最后对路面病害进行分割。

1 样本选取与特征提取

1.1 2D Otsu 训练样本选取

极限学习机被广泛应用在图像分类识别领域中,将其作为分类器逐渐成为热门话题。由于训练样本大多人工选取,这让图像分割的自适应性较低且影响分类器的分类准确性。为此采用二维Otsu对训练样本进行自动选取。

Otsu 是传统的阈值分割方法,不能反映图像的空间信息。在噪声干扰下,仍按照一维灰度特征就会出现错分割现象。二维Otsu 利用原图与邻域平滑图像构建二维直方图,它在包含图像的灰度信息的同时考虑了像素点与邻域的空间关系,这使图像的抗噪性能得到提高,改善了分割效果。

本文首先将原始的RGB 图转化为灰度图像,设灰度图像中的一个像素点为f(i,j),像素的邻域大小为n×n,则它的邻域灰度均值为g(i.j) =。根据2D Otsu[8]计算出最佳阈值(s0,t0)*。其中s0是灰度分割阈值,t0是邻域分割阈值。抽取200 个大于s0和t0的像素点作为训练正样本。

1.2 特征提取

纹理特征是图像的固有特征之一,它主要提取灰度分布信息。将纹理特征作为训练样本的特征属性已较为常用,但只提取单一纹理特征无法对路面病害进行有效描述。考虑到病害边缘梯度值较大,而非目标区域梯度值较小。梯度方向直方图(Histogram of Oriented Gradient,HOG)能较好地描述梯度信息。综合利用纹理特征和形状特征要比单独使用纹理特征或者形状特征获得更好的分类性能。所以,本文对训练样本进行LBP 特征提取和HOG 特征提取,并将提取的特征向量进行融合。

纹理特征使用局部二值模式,它具有无参数,计算简单的优点。LBP 算子在3×3 的邻域中,以中心像素(xc,yc)为阈值,将周围8 个点与阈值做比较。如果周围像素点大于等于中心像素,则像素点置为1,否则置为0。Ojala[9]对LBP 算子进行改进,采用不同半径的圆形邻域代替固定范围的正方形邻域。该方法可以适应不同尺度的纹理特征,并达到灰度和旋转不变性的要求。LBP 提取公式为:

式中:n是中心像素总数,ip是第p个邻域像素灰度值,ic是中心像素灰度值,I(ip-ic)=

对训练样本进行HOG 提取。其中训练样本像素为40 pixel×40 pixel,元胞大小为8×8,块大小为16×16,每个块的梯度直方图为2×2×9 =36 维,则HOG 特征维数为7×7×36 =1 764。

将提取的LBP 特征和HOG 特征使用增广特征向量进行串行融合。融合公式为:

式中:λ=0.5 为权重系数;x,y为样本空间对应的特征向量。

1.3 PCA 降维

上述得到的特征向量数据量大且输入数据的数目和维数越多,训练部分的计算越复杂。为有效缓解计算复杂度与时间消耗,采用PCA 进行降维。它的实质是通过基变换,把存在相关性的一系列变量转变为互不相关的变量,同时根据需要提取出综合性强的变量即为主成分。

本文利用PCA 线性拟合的思路对得到的特征向量进行线性组合,构建其协方差矩阵,计算协方差矩阵的特征值和特征向量按从大到小进行排序,保留前k个特征。尽可能多地反映原来各病害的特征的信息。主成分分析法步骤如下:

(1)对上述特征向量按行排列组成m行n列的原始数据;

(4)求出协方差矩阵的特征值λ和相对应的特征向量w公式如下:|C-λI|=0,cw=λw;

(5)通过特征值占比来确定主成分;

(6)计算贡献率Rk即前k个主成分相对所有主成分所占比:Rk=

(7)将满足条件的前k个特征向量进行组合并进行投影,得到降维后的新k维特征。其投影过程即为降维过程。

由上述分析可知,当主成分贡献率达到85%~95%时,经过PCA 处理的特征向量y可以代替原始特征进行学习,即。

2 GA-KELM

极限学习机(Extreme Learning Machine,ELM)是单隐层前馈神经网络,被广泛应用于分类问题。它与传统的基于梯度反向传播的学习算法相比具有如下优点:①运算速度快。因为输入层与隐含层的连接权值随机产生,隐含层与输出层的连接权值通过解方程得到而非迭代调整,这使得学习速度大大降低。②人为干预少,使用方便。只需调整ELM 中隐含层神经元个数便可获得较好的性能。③ELM与SVM 和BP 神经相比泛化性能好。ELM 的原理如图1 所示,它由输入层、隐含层和输出层组成。

图1 ELM 原理图

x为输入样本的特征向量,ωi为输入层与隐含层的连接权值ωi=[ωi1,ωi2,…,ωin]T,βi为隐含层与输出层的连接权值βi=[βi1,βi2,…,βim]T,y为样本对应的标记向量;h(x)为隐含层输出h(x)=[h1(x),…,hL(x)]。hi(x)计算公式如下:

式中:g(·)为激活函数;Wi为第i个输入层与隐含层的连接权值;βi为第i隐含层与输出层的连接权值;bi为第i个隐含层单元的偏差。

在极限学习机中,输入权重ωi和隐含层偏差bi无需人为干预,随机给定。隐含层与输出层的连接权值可以将其转化为一个线性系统进行求解。即Hβ=Y′,β*=H+Y。H+为矩阵的Moore-Penrose 广义逆矩阵。因此,只需确定隐含层神经元个数,便可得到唯一最优解。

将极限学习机作为分类器使用时,其决策方程为:

在H未知时,用核函数K(u,v)代替式(4)中的h(x)HT和HHT即为核极限学习机。

由于KELM 中输入权重ωi和隐含层偏差bi随机给定,这让分类器的不确定性增加。为此,本文采用遗传算法对ωi和bi进行优化,改进方法如下:对随机给定的ωi和bi进行二进制编码,设为初代种群。计算个体适应度,适应度函数设为测试样本的输出值与期望值的误差。若满足条件,值则解码输出为最佳权值和偏差,否则进行选择交叉和变异操作产生新的个体,不断迭代直至满足条件。流程图如图2 所示。参数设置为:种群大小为60,最大遗传代数为200,交叉概率为0.6,变异概率为0.01。

图2 GA-KELM 流程图

综上,只需设置激励函数和隐含层神经元数目便可对GA-KELM 进行学习。本文的激励函数为sigmoid 函数。不同隐含层神经元个数对分类准确性有一定影响,为了让GA-KELM 的分类性能达到最优,分别将经过PCA 降维的特征向量与未经降维的数据输入到训练模型中。从10 个节点开始依次增加10 个,来寻找分类准确率最高时所对应的隐含层神经元节点数。如图3 所示。

图3 隐含层神经元个数对分类的影响

经过PCA 处理的路面病害数据在隐含层神经元节点数为60 时,分类准确率达97%。而未经PCA 处理的数据则是在神经元个数为70 时分类准确性达到极大值,比已经过处理的增加了10。随着隐含层数目的增加,分类准确性波动较大且在达到极值后有所下降。因此,通过PCA 降维可以有效减少训练样本特征的向量维数,在保证训练样本特征多样性的情况下缓解计算的复杂度。

3 实验结果分析

实验在软件MATLAB R2015b 而硬件为Intel(R)Core(TM)i5-4210M CPU 下,对大小为300 pixel×200 pixel的200 张路面病害图像进行实验。

将本文算法与文献[10]由多个特征训练得到的分类器进行对比。分割结果如图4 所示,图中中间一列为本文算法所得结果。

从图4 可以看出,这两种算法对于横向和网状裂缝的分割效果较为理想,裂缝边缘清晰。但对于坑洼和车辙等复杂病害分割效果较差。图4(c)中,坑洼与网状裂缝的连接处没有分割出来。边缘细节不明显,出现像素点丢失与过分割现象。图4(e)中,病害目标占背景区域比重较大,分割时易受噪声干扰。采用对比算法已无法区别病害和松散。而使用本文算法进行分割,不仅抗干扰能力强而且对这两种病害细节保留较好。

图4 不同算法对路面病害检测结果对比

分别计算图像的结构相似性(Structured Similerity,SSIM),其值越接近1,表明分割的精度越高。结果如表1 所示。

表1 分割性能SSIM 值比较

本文算法的SSIM 值稳定在0.93 左右,波动起伏不大。加入亮度特征后分割精度反而下降,这是因为受光照不均匀影响增加了目标和背景判决的难度。与对比算法相比,坑洼、车辙和松散的分割准确率分别提高了19.6%和30%。因此特征的选择尤为重要,不恰当的特征会使分割精度下降。

为进一步验证分类器的性能,对路面病害图增加噪声密度为0.02 的椒盐噪声然后分别计算GA-KELM、ELM 和SVM 的分类准确率性和运行时间。计算结果如表2 所示。由表2 可以看出,ELM需要调用的参数少,运行时间快但分类精度还需进一步提升。即使存在噪声干扰,GA-KELM 的分类准确度仍较高,虽耗时比传统的ELM 分类器高但满足实时检测的要求。

表2 分类准确率与运行时间

4 结束语

本文采用二维Otsu 自动选取训练样本克服了人工选取样本的缺陷。综合了纹理特征和形状特征以提高对复杂路面病害检测的适应性。但随着特征维数的增加,训练复杂度提高。通过主成分分析法选择少数综合性强的特征向量来代表原始的特征信息更能反映图像的本质特征。再将其作为特征属性对改进的核极限学习机进行训练产生分类器。把对路面病害分割转化为对像素的分类。实验结果表明,本文算法对复杂病害的分割精度较高,和对比算法相比提高了近24.8%。但本文只选取了2 种特征属性,若再选取其他特征属性,则新特征维数会对分割准确度产生影响。

猜你喜欢

训练样本特征向量分类器
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
基于朴素Bayes组合的简易集成分类器①
人工智能
基于特征选择的SVM选择性集成学习方法
一类三阶矩阵特征向量的特殊求法
基于差异性测度的遥感自适应分类器选择
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
基于层次化分类器的遥感图像飞机目标检测