APP下载

深度卷积神经网络的汽车车型识别方法*

2016-11-04杨正瓴朱新山杨伯轩

传感器与微系统 2016年11期
关键词:网络层训练样本维数

张 军,张 婷,杨正瓴,朱新山,杨伯轩

(1.天津大学 电气与自动化工程学院,天津 300072;2.天津市过程检测与控制重点实验室,天津 300072)



深度卷积神经网络的汽车车型识别方法*

张 军1,2,张 婷1,2,杨正瓴1,2,朱新山1,2,杨伯轩1,2

(1.天津大学 电气与自动化工程学院,天津 300072;2.天津市过程检测与控制重点实验室,天津 300072)

针对现有汽车车型识别方法计算量大、提取特征复杂等问题,提出一种基于深度卷积神经网络的汽车车型识别方法。该方法借助于深度学习,对经典的卷积神经网络做出改进并得到由多个卷积层和次抽样层构成的深度卷积神经网络。根据五种车型的分类结果,表明该方法在识别率方面较传统方法有明显的提高。实验还研究了网络层数、卷积核大小、特征维数对深度卷积神经网络的性能和识别率的影响。

深度学习; 深度卷积神经网络; 汽车车型识别; 特征提取

0 引 言

随着人民生活水平的不断提高,汽车数量日益增多,道路承载状况与汽车增长量之间的矛盾愈发突出,由此产生的道路堵塞、交通环境恶化等问题,进一步加剧了交通压力[1]。汽车车型识别问题作为模式识别领域在智能交通系统方向的重要应用,在交通监控和管制、交通事故责任判定等方面有十分显著的作用。

目前常用的汽车车型识别方法有:基于多传感器的车型检测方法[2],该方法原理简单,实现容易,但对外界环境的适应性不强,故障率较高;基于尺度不变特征转换(scale-invariant feature transform,SIFT)特征的车型识别方法[3~5],SIFT算法具有旋转、尺度缩放和视角不变性,缺点是特征向量的维数过高,容易产生“维数灾难”;基于分类器的车型识别方法,常用到粒子群优化(particle swarm optimization,PSO)算法、云模型理论[6]、遗传算法等智能算法,但一般要求较大的训练样本。

深度学习作为传统机器学习的延伸和扩展,已在众多领域得到广泛应用[7~10]。卷积神经网络作为深度学习的一种,延续了深度学习自动学习提取特征的特点,利用局部感受野和共享权值等方法,泛化能力强,识别效率高,广泛应用于语音识别[11]、车牌识别[12]等方面。

本文提出一种基于深度卷积神经网络(deep convolutional neural network,DCNN)的汽车车型识别方法,用来区分货车、大巴车、公交车、面包车和轿车五种车型。本文方法改进了传统车型识别方法,并通过实验证明有较好的识别率和一定的可行性。

1 卷积神经网络

卷积神经网络可视为一个多层网络,其结构示意图如图1。

图1 卷积神经网络结构示意图Fig 1 Structure diagram of convolution neural network

1.1 卷积层

一个卷积层可包含多个特征图,特征图中的每个神经元与前一层的局域感受野连接,并与具有学习能力的卷积核进行卷积获取局部特征,由激活函数输出得到该层的特征图。激活函数通常为Sigmoid函数。一般地,卷积层的计算公式和激活函数分别为

(1)

(2)

式中 l为网络层数,k为卷积核,Mj为输入层的感受野,b为每个输出图的一个偏置值,e为自然指数,约取2.718 28。

1.2 次抽样层

次抽样层是对输入进行采样操作,输入的特征图由池化操作后个数保持不变,但大小变为原来的1/n(假设的池化尺寸为n)。池化操作的主要目的是降低特征图的分辨率,减小特征维数。次抽样层的一般形式为

(3)

式中 down(·)为池化函数,β为权重系数。

1.3 全连接层

在卷积层和次抽样层之后,会连接一个或多个全连接层。卷积层和次抽样层用于提取输入图像的特征,并将其全部反馈到全连接层进行特征分类,由输出层输出最终结果。

2 DCNN的汽车车型识别方法

2.1 DCNN的结构模型

卷积神经网络的最早应用是手写字符的识别,用到的经典卷积神经网络共有5层,卷积核大小为5×5,但不能将其直接应用到车型识别中。经过分析比较,主要有两点原因:

1)手写字符识别的输入为Mnist样本集,其内容简单,颜色单一,而车型识别的输入来源于部分UIUC大学[13]车型识别库图片和真实采集的车型图片,这些图片背景复杂,经典卷积神经网络的层数过小,无法提取有效特征。

2)Mnist样本集为28×28,而车型识别的输入经过处理后为128×64,经典网络的5×5卷积核过小,卷积结果无法表达有效信息。

由以上分析可知,需要对网络深度和卷积核大小等进行修改。最终确定DCNN共有7层(不包括输入层和输出层),卷积核大小为9×9,全连接层神经元个数为500左右,输出层有5个神经元输出5种车型。

第一层是卷积层C1,每个神经元与输入图像指定的一个9×9邻域进行卷积,特征图大小变为120×56,C1层包含30个不同的特征图。

第二层是次抽样层S2,S2是对C1层用2×2的邻域进行最大池下采样得到,因此,特征图大小为60×28,次抽样不改变特征图的数目。

第三层是卷积层C3,可得到C3层特征图大小为52×20,特征图个数变为60个。

第四层是次抽样层S4,用2×2的窗口进行最大池下采样,得到特征图大小为26×10。

第五层是卷积层C5,同理可得C5层特征图大小为18×2,特征图个数为120个。

第六层是次抽样层S6,用2×2的窗口得到特征图大小为9×1。

第七层是全连接层F7,包含500个(不一定为准确值,但靠近500)神经元,和S6全连接。

由于对5种车型进行分类,因此,输出层包括5个神经元。神经元由径向基函数单元(RBF)组成,RBF的输出yi的计算公式为

(4)

2.2 汽车车型识别的实现方法

DCNN的汽车车型识别方法包括车型的训练和识别,现将车型识别的实现方法分为4个步骤,流程图如图2所示。

图2 汽车车型识别流程图Fig 2 Flow chart of vehicle model recognition

1)确定DCNN的结构:分别设定DCNN中各层的层数,卷积核大小和分类器,其中卷积层和次抽样层提取车型特征,分类器用于车型的分类识别。

2)采集图像并进行预处理:除UIUC大学车型识别库的图片外,为保证数据的多样性,还包含不同的车型、地点(十字路口、高速公路等)、时间(白天、夜间等)和天气(晴天、雨天等)的图像。图像采集好后需进行预处理使图像为128×64。

3)训练DCNN:利用(2)中的训练样本训练改进后的DCNN,将训练好的权重参数矩阵和偏移量赋值给该网络的各层,则具有特征提取和分类功能。分类器采用Softmax分类器,计算车辆属于不同类型的概率,计算公式

(5)

4)测试DCNN:经过训练得到DCNN和分类器后,使用测试图片测试网络,计算出车辆属于不同类别的概率d1,d2,d3,d4,d5,选择其中的最大值dj,则该车辆属于第j种车型。

3 实验结果与分析

3.1 实验数据

为了验证本文DCNN的性能,实验采用UIUC大学车型识别库图片和天津狮子林大街黄网格区域拍摄的图片作为实验图片。实验共1 000张样本图,其中800张作为训练样本(UIUC车型识别库图片100张,且全部作为训练样本),200张作为测试样本。由于拍摄图片存在噪声、失真及干扰等现象,经预处理后部分训练样本图片如图3所示。

图3 各种车型的部分训练样本图片Fig 3 Images of part of training sample of various kinds of vehicle models

3.2 实验结果分析

本文分别对5种车型进行研究,训练样本包括货车120辆,大巴车130辆,公交车170辆,面包车180辆,轿车200辆。为显示本文方法的实验结果,采用SIFT算法和PSO算法作为对比,识别率结果如表1所示。由表1可知,本文方法的识别率明显较高,比SIFT的识别率平均高约8 %,比PSO平均高约10 %。

表1 三种算法的识别率/%

基于DCNN的结构特点,本文对可能影响网络性能的参数进行研究。在网络深度方面,分别取3,5,7,9,卷积核大小均为9×9,特征维数500左右。不同网络层数的识别率如表2所示。当网络层数为3时,网络无法收敛;网络层数为5,7,9时,网络收敛,其中7层网络结构具有较高的识别率。

表2 不同网络层数的识别率

在卷积核大小方面,分别取5×5,7×7,9×9,11×11的卷积核进行对比,网络层数为7,特征维数500左右。不同卷积核大小的识别率如表3所示。当卷积核大小为5×5时无法进行特征提取;其他卷积核大小均能完成识别过程,9×9卷积核识别率最高且稳定性好。

表3 不同卷积核的识别率

在特征维数方面,分别取5组不同值,网络层数为7,卷积核大小为9×9。不同特征维数的识别率如表4所示。特征维数较小会使特征描述不充分,特征维数较大会产生过拟合。因此,应根据实际样本的特征和复杂度调整特征维数,达到理想的分类效果。

表4 不同特征维数的识别率

4 结束语

本文对汽车车型识别的多种方法进行深入研究,利用深度学习,提出一种基于DCNN的汽车车型识别方法,并结合输入图像的尺寸、复杂性等特点对经典卷积神经网络做出改进。本文详细说明了DCNN的结构,对网络层数、卷积核大小和特征维数进行改进,使测试样本的识别率能达到96.8 %,比SIFT算法和PSO算法的平均识别率分别高约8 %和10 %。实验还对DCNN的主要参数进行对比研究,分析参数变化对识别率的影响。实验结果表明:本文提出的方法在输入图像的不同条件下识别率较高,对汽车车型识别问题鲁棒性好,证明本文的方法学习能力较强,具有一定的可行性和实用价值。

[1] 蔡伯根,赵济民,王 剑,等.三轴AMR车辆检测器的车型分类设计实现[J].交通运输系统工程与信息,2014,14(4):46-52.

[2] 杨三序.电容式传感器在车辆检测装置中的应用[J].传感器技术,2004,23(9):74-76.

[3] 华莉琴,许 维,王 拓,等.采用改进的尺度不变特征转换及多视角模型对车型识别[J].西安交通大学学报,2013,47(4):92-99.

[4] Lowe D G.Distinctive image features from scale-invariant key points[J].International Journal of Computer Vision,2004,60(2):91-110.

[5] Lowe D G.Object recognition from local scale invariant feature-s[C]∥Proceedings of the International Conference on Computer Vision,Piscataway,NJ,USA:IEEE Computer Society,1999:1150-1157.

[6] 唐朝霞,俞扬信,张 粤.基于粒子群算法和云模型的车型识别[J].微电子学与计算机,2013,30(11):80-83.

[7] Sarikaya R,Hinton G E,Deoras A.Application of deep belief networks for natural language understanding[J].IEEE Transactions on Audio Speech and Language Processing,2014,22(4):778-784.

[8] Graves A,Mohamed A,Hinton G E.Speech recognition with deep recurrent neural networks[C]∥IEEE International Conference on Acoustic Speech and Signal Processing,ICASSP 2013,Vancouver,BC:IEEE,2013:6645-6649.

[9] Ciresan D,Meier U,Schmidhuber J.Multicolumn deep neural networks for image classification[C]∥Computer Vision and Pattern Recognition,Providence,RI:IEEE,2012:3642-3649.

[10] Dahl G E,Sainath T N,Hinton G E.Improving deep neural networks for LVCSR using rectified linear units and dropout[C]∥2013 IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP),IEEE,2013:8609-8613.

[11] Sainath T N,Mohamed A R,Kingsbury B,et al.Deep convolutional neural networks for LVCSRA[C]∥Proc of IEEE International Conference on Coustics,Speech and Signal Processing,2013:8614-8618.

[12] 赵志宏,杨绍普,马增强.基于卷积神经网络LeNet—5的车牌字符识别研究[J].系统仿真学报,2010,22(3):638-641.

[13] UIUC.车型数据库[EB/OL].(2010—06—01)[2012—03—17].http:∥vangogh.ai.uiuc.edu/silvio/3ddataset2.html.

张 军(1964- ),男,天津人,硕士,副教授,主要从事智能交通系统、计算机视觉与图像处理方面研究工作。

Vehicle model recognition method based on deep convolutional neural network*

ZHANG Jun1,2,ZHANG Ting1,2,YANG Zheng-ling1,2,ZHU Xin-shan1,2,YANG Bo-xuan1,2

(1.School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China;2.Tianjin Key Laboratory of Process Measurement and Control,Tianjin 300072,China)

Aiming at problems of excessive calculation and complex feature extraction of existing vehicle model recognition methods,a vehicle model recognition method is proposed based on deep convolutional neural network(DCNN).With the aid of deep learning,improvement is made on classic convolutional neural network and DCNN made of multiple convolutional layers and time sampling layers is gained.According to classification results of the five models,it shows that this method has obvious increase than traditional methods in terms of recognition rates.The experiments also study on influences of number of network layer,size of convolutional kernel,characteristic dimension on performance of DCNN and recognition rates.

deep learning;deep convolutional neural network(DCNN);vehicle model recognition;feature extraction

10.13873/J.1000—9787(2016)11—0019—04

2016—01—21

天津市科技计划基金资助项目(13ZXCXGX40400)

TP 391

A

1000—9787(2016)11—0019—04

猜你喜欢

网络层训练样本维数
β-变换中一致丢番图逼近问题的维数理论
一类齐次Moran集的上盒维数
人工智能
论物联网安全威胁及其应对策略
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
物联网技术在信息机房制冷系统中的应用
Current advances in neurotrauma research: diagnosis, neuroprotection, and neurorepair
具强阻尼项波动方程整体吸引子的Hausdorff维数