APP下载

基于Gabor滤波器和SVM结合的中华蜂图像识别方法

2021-10-09林寿英王彩霞李新亮张晓青谢奕涛

农业工程 2021年8期
关键词:降维特征向量内核

刘 超,林寿英,王彩霞,李新亮,张晓青,谢奕涛

(1.福建农林大学,福建 福州350002; 2.闽江学院,福建 福州350108)

0 引言

中华蜜蜂(Chinese bee),简称中华蜂,属于蜜蜂科药用最广的昆虫之一,其自身的价值以及采集到的蜂蜜均被用于医疗和养生领域数年之久。在医药界中华蜂的价值更是被放大化,不仅能治疗常见的烧伤烫伤,而且对于心脏病的治疗还能起到举足轻重的作用。位于福建省福州市的中华蜂养殖产业也是紧跟时代要求,一步一步发展壮大。

国内关于中华蜂的检测还处在人为检测阶段,耗费大量的人力和时间。国内对于中华蜂的识别还处于依赖光电传感器的检测阶段,由于传感器自身的安装不便捷、维护成本高,以及检测结果准确性不高等问题,致使传统中华蜂的识别方式没办法得到推广应用。中华蜂的图像分类对于中华蜂养殖产业来说始终处于不可或缺的地位,对于近些年全球智能化的发展趋势,国内许多养殖产业纷纷处于被动状态。在这些养殖产业中蜜蜂养殖产业却在不断地更迭技术,发展壮大。本研究将图像识别与中华蜂养殖相结合,通过图像识别方式高效识别出中华蜂物种,为后期智能蜂箱养殖系统做足准备工作。

本文提出基于Gabor特征提取的SVM中华蜂识别方法,该方法首先将人工采集到的图片进行统一灰度化、归一化处理,并对处理后的图片经过Gabor滤波器进行特征向量提取,将提取后的高维特征向量进行PCA降维,随后采用支持向量机进行训练和建模,对比不同核函数SVM的建模时长、识别准确率及识别图像的时长,选择出最佳的核函数。

1 框架结构

依据所采集到的中华蜂图像,将图片进行预处理,降低外界因素对图像造成的影响,对处理后的图像进行归一化,使得图像的大小保持一致,为后续Gabor滤波器提取特征值做铺垫。经过特征提取后的图片再一次进行以下采样方式降维,最后将降维后的特征向量采用不同核函数的SVM机进行分类和识别,试验流程如图1所示。

图1 试验流程Fig.1 Experimental flowchart

2 特征提取

2.1图像预处理

中华蜂图片均是由试验小组人员进行采集,得到的图片统一进行灰度化及归一化处理,使得数据库中的所有图片统一灰度减少外界环境对图片的影响,并且图片保持在32×32像素的大小,为后续的特征提取步骤做好铺垫[1]。

2.1.1图像灰度化

定义RGB空间的彩色图片,每一个像素点均是由R、G、B的3个分量共同决定,每个分量在内存所占的位数共同决定了图像的颜色。对于将RGB图像进行灰度化处理,即对图像RGB的3个分量进行加权平均进而得到最终的灰度值,本次研究采用OpenCV开放库中所采用的灰度权值,如式(1)所示[2-3]。

Gray=0.072 169B+0.715 160G+0.212 671R

(1)

2.1.2图像归一化

人工采集到的中华蜂图片容易受到拍摄角度或拍摄距离的影响,造成收集到的图片大小尺寸不一,对后续的特征提取造成了不必要的麻烦,故采用OpenCV库函数将所采集的图片进行大小统一调整,得到32×32像素的图片库。

2.2特征提取

Gabor滤波器可以抽取空间局部频率特征,是一种有效的纹理检测工具。在图像处理中,Gabor函数属于边缘提取的线性滤波器,滤波器自身的频率和方向表现内容与人类视觉系统相近[4-5]。不同参数构成的二维Gabor滤波器具有明显的空间显著性,以及在方向和频率的抉择方面具有显著的优势,所以其在模拟视觉神经方面可以获得较好的效果。

二维Gabor滤波器的一般函数表达式:

(2)

式中kμ,v=kveiφμ

z=(x,y)——空间位置

v——Gabor滤波器尺度参数

μ——Gabor滤波器方向

kμ,v——平面波矢量

σ——高斯窗口尺度因子

exp(ikμ,v)——复数波,其中实数部分和虚数部分分别为cos(kμ,z)和sin(kμ,z)

(3)

式中kmax——最大频率

f——频域内核函数的空间因子

φμ——Gabor滤波器的方向选择

二维Gabor滤波器的函数一般具有自相似的特性,故又称为Gabor小波。在Gabor滤波器中参数的选择起着举足轻重的作用,为了更加充分地描述图像特征,采取在5个尺度和8个方向上组成滤波器组,即v={0,1,2,3,4},μ={0,1,2,3,4,5,6,7}。因为图像的纹理分布是随机的,φμ的取值范围是0~2π,由于Gabor滤波器自身的对称性,φμ的取值范围可以等价于是0~π。

2.3特征向量降维

中华蜂图像经过Gabor滤波器提取后的特征向量具有较高的维数,由于图像归一化后像素为32×32,经过根据本研究所选取的尺度和方向参数得到图像的Gabor特征位数是灰度图像维数的40倍,即提取后的维数为40 960(32×32×40),致使检索速度变慢,所以要对其产生的特征向量进行线性降维操作,即主成分分析法(PCA)。

主成分分析法是通过某种线性投影,将高维数据映射到低维的空间中,并期望在所投影的维度上数据所保留的信息量最大,不失真程度最低,等价于方差最大[6]。以此降低数据高维不易处理的难度,且更大程度地保留了数据信息的完整性。

假设有数据中含有M个样本{X1,X2,…,XM},每个样本均是含有N维特征,即Xi=(x1,x2,…,xN)T,且每一个特征xj均含有自身的特征值。第一步对所有特征进行中心化,去除自身的均值,即

(4)

第2步对去均值后的特征值进行协方差矩阵C的求解,即

(5)

式(5)中cov(xi,xi+1)表示为

(6)

第3步求解协方差矩阵C的特征值和相应的特征向量,求解协方差矩阵C的特征值λ和μ特征向量,即

Cu=λu

(7)

数据集中的特征值λ有N个,每一个λi对应一个特征向量ui,将求得的特征值按照从大到小的顺序排列,并选择前k个特征值,将提取到的k个特征值组合成一组新的矩阵,即{(λ1,u1),(λ2,u2),…,(λk,uk)}[7]。

最后将原始的数据矩阵集合投影到选取的特征向量上,即可得到降维后的k维特征向量,即

(8)

3 支持向量机

支持向量机(SVM),又称为支持向量网络,具有相关学习算法的监督学习模型,该算法对数据进行评估和识别,并应用于分类和回归分析,对于未经训练的样本具有较高的预测准确率。SVM的实现原理:通过已选择的核函数将输入向量映射到一个高维数特征空间中,在这个高维特征空间中构造一个最优分类的超平面[8]。

由于决策边界直接取决于训练数据自身,因此决策边界的分离余量在训练SVM模型中称为特征空间的高维空间中最大化。该学习策略基于统计学习理论,该理论将训练数据和未知数据分类中的错误最小化。

支持向量机可以看作为内核机,内核常常被称为相似性函数,用于提供给机器学习算法功能[9-10]。

SVM常见的内核如下。

(1)径向基函数。在机器学习中,径向基函数核(RBF)是一种局部性强的核函数,其可以将样本映射到更高维的空间中,应用范围广,无论样本大还是小都能表现出较强的性能[6]。

对于两个样本X和Y,RBF核函数表示为某些输入空间中的特征向量,定义为

(9)

(2)多项式函数。多项式内核用于识别输入样本的标注特征以此确定之间的相似性和他们的组合关系。在回归分析的框架中,该类型组合成为交互功能。多项式内核的隐式特征空间与多项式回归的隐式特征空间相似,但是二者之间的模型学习参数没有关联。多项式核函数可以实现将低维的输入空间映射到高维的特征空间,但是多项式核函数的参数多,当多项式的阶数比较高的时候,核矩阵的元素值将趋于无穷大或者无穷小,计算复杂度会大到无法计算。对于q≥1时,多项式内核函数定义为

(10)

(3)线性核。线性核主要用于线性可分的情况下,特征空间与输入空间的维度是相同的,且其自身参数少,运算速度快,对于线性可分性数据,其分类效果明显[7]。其核函数定义为

K(x,y)=xTy+c

(11)

(4)二次内核。二次内核的计算强度较RBF较低,当RBF的准备过程变得繁杂时,二次内核是一个适宜的替代方案。其定义为

(12)

(5)Sigmoid核。Sigmoid核函数被采取时,支持向量机实现了一个包含隐藏层的多层感知机网络模型,其中的权值和隐藏层节点数均是由SVM算法内部自动拟合而形成的,其定义为

K(x,y)=tanh[v(x·y)]+c

(13)

4 试验结果

4.1试验环境

本研究的训练平台为一台台式机,硬件部分为Intel core i9-10850K(3.6GHz)十核CPU,以及GeForce GTX 1080ti 11GB GPU(3584 CUDA)和32 GB的内存,在Windows 10 64位系统上运行,软件部分采用Python3。

人工采集到的中华蜂图片共有3类(蜂王、雄蜂、工蜂),共6 930张图片,将得到的图片灰度化并归一化处理后,得到32×32像数大小的图片,之后经过Gabor滤波器提取特征向量并进行采样,得到的特征向量进行PCA降维。降维后的特征向量经过不同核函数的SVM进行训练、建模并预测分析。

4.2对比及分析

人工采集到的蜜蜂样本如图2所示。

图2 人工采集的蜜蜂样本图像Fig.2 Bee sample images collected manually

将采集到的图片进行灰度化、归一化并由Gabor滤波器进行特征提取后,得到如图3所示的图片,将蜜蜂与蜂巢二者的纹理特征进行有效的提取,更加突出了图片的特征。

图3 经过预处理及Gabor处理后的图像Fig.3 Sample image obtained after preprocessing and Gabor processing

进一步将取得的图像矩阵进行PCA降维后并交由不同核函数的SVM进行训练。训练结果如表1所示。

表1 训练结果

从结果中可以看出,在建模时间上径向基核函数和Sigmoid核函数花费的时间很长,但是在预测准确率方面优势十分明显,而多项式、线性及二次核函数在训练建模耗费时长上占据优势,却在预测准确率上相较其余二者较低。综合对比5种核函数,Sigmoid核函数在对于经过预处理及Gabor提取特征后得到中华蜂图像的SVM识别预测中占据优势。

5 结束语

对采集到的中华蜂图像进行预处理及特征提取并降维后,经过分析不同核函数的SVM所得出的建模时间,预测准确率以及识别时长,可以得出在常见的SVM核函数中Sigmoid核函数对于中华蜂的识别分类效果最好,为随后的中华蜂图像识别研究奠定基础。

在蜂箱养殖蜜蜂过程中抑制有害物种的入侵对蜂农增加的工作负荷很大,同时在抑制过程中蜂农开箱检测的工作量也十分庞大。本研究将图像识别应用于蜂箱养殖,有效识别出中华蜂,为后期识别危害中华蜂的物种,即蟑螂和马蜂,提供前期的准备工作,为智能蜂箱的建立提供了坚实的算法基础。

猜你喜欢

降维特征向量内核
混动成为降维打击的实力 东风风神皓极
克罗内克积的特征向量
基于数据降维与聚类的车联网数据分析应用
高中数学特征值和特征向量解题策略
强化『高新』内核 打造农业『硅谷』
活化非遗文化 承启设计内核
降维打击
微软发布新Edge浏览器预览版下载换装Chrome内核
三个高阶微分方程的解法研究
矩阵方法求一类数列的通项