APP下载

基于GAPSO-SVM模型的行驶工况识别

2022-03-31孙晶云鲁东丽郭军高云陈宇峰向郑涛

湖北汽车工业学院学报 2022年1期
关键词:超平面特征参数粒子

孙晶云,鲁东丽,郭军,高云,陈宇峰,向郑涛

(1.湖北汽车工业学院 电气与信息工程学院,湖北 十堰 442002;2.浙江鸿程计算机系统有限公司,浙江 杭州 311100;

3.东风汽车动力零部件有限公司,湖北 十堰 442000)

车辆在行驶过程中能量消耗会受工况影响,针对不同工况制定不同的车辆能量管理策略,可以达到节能减排的效果[1-2]。目前国内外不少学者对行驶工况识别算法进行了研究,王宪彬[3]等人分析了商用车在行驶过程中的工况特点,基于朴素贝叶斯分类器对高速公路行驶工况进行识别。Lin等人[4]采用K-means算法对工况进行聚类,通过学习向量量化神经网络实时识别行驶工况。文献[5]基于聚类理论对3类行驶工况进行识别,并制定了混动车能量管理策略。Xie 等人[6]和Hazal 等人[7]提出利用模糊控制器结合其他模型进行工况识别。上述方法中,传统聚类算法对聚类中心敏感,中心值选取对识别结果影响大;使用传统的神经网络算法时,需要预先获得大量训练数据,在实际操作中有一定困难,如训练时间过长、数据量小时训练效果不佳等[8];传统模糊识别方法对专家经验依赖大,需要反复调整隶属度函数。SVM通过更改重要参数影响识别精度[9],PSO算法可以快速搜索到最优参数,但是有陷入局部最优的可能性[10]。为避免以上问题,文中结合SVM和PSO算法的特点,提出了基于遗传粒子群优化支持向量机(genetic algorithm for particle swarm optimization support vector machine,GAPSO-SVM)模型的行驶工况识别算法,并将优化后的GAPSO-SVM 模型与K-CV-SVM 模型、PSO-SVM模型进行对比分析。

1 GAPSO-SVM模型简介

1.1 SVM算法原理

传统SVM 是经典的二分类算法,该算法将输入的样本特征参数变换至高维特征空间,使样本线性可分,再求解寻找超平面,在保证识别精度的同时使该超平面与样本间的间隔尽可能大[9]。假设给定训练样本:

式中:xi为输入样本;yi为对应样本的标签。超平面记作:

式中:w为超平面的法向量;b为超平面的截距。距离超平面最近的样本点为支持向量,不同类别的支持向量间隔d为

构建Lagrange函数求解该约束优化问题:

式中:ai为各样本的Lagrange 乘子,是非负变量。分别对式(5)中的w和b求偏导数并置零,将该约束优化问题转为对偶问题,从样本中得到超平面的决策函数:

在解决实际问题时,样本通常是非线性可分的。针对非线性问题,SVM引入了核函数,同时定义松弛变量ξi≥0 和惩罚系数C>0。假定存在1 个非线性转换φ(x),样本通过该转换可映射到高维特征空间,在新的特征空间中构造超平面。此时超平面的决策函数为

常用的核函数有线性核函数、多项式核函数和高斯核函数,由于高斯核函数可映射到无穷维度,且结构不复杂,文中使用经验法选取常用的高斯核函数作为核函数[9-11]:

式中:g为核函数宽度。在SVM 求解过程中,参数C和g的选取对分类效果影响大。C越大表示容错性越小,可能出现过拟合,C越小则可能欠拟合;g越大表示支持向量越少,g越小则支持向量越多。文中通过GAPSO算法对C和g进行参数寻优。

1.2 PSO算法原理

标准PSO 算法中,各粒子进行信息传递,粒子记录并更新个体极值pb和全局极值gb,根据个体和群体的经验进行速度调整[12]:

式中:ω为惯性权重系数,ω越大则越倾向于全局搜索,反之则倾向于局部搜索;vti为第t次迭代时粒子i的速度;c1、c2为学习因子,是非负常数,分别调整粒子向pb和gb位置飞行的最大步长,学习因子越大粒子飞向目标区域的速度越快,存在越过目标区域的可能,反之速度越小,存在远离目标区域的可能;r1、r2为[0,1]的随机数。根据速度,粒子对自身位置xi进行更新:

1.3 GAPSO-SVM算法

PSO算法具有收敛速度快的特点,同时可能因为过早收敛陷入局部最优。GAPSO算法通过引入GA 中的杂交和变异操作,允许粒子在过早收敛前跳出局部最优搜寻其他区域[10]。杂交概率pc和变异概率pm为[0,1]的随机数,随机选取2个粒子xcr1、xcr2,根据pc决定该轮循环是否进行杂交操作,新粒子的位置更新公式为

若杂交后子代适应度高于父代,粒子位置更新为子代位置,否则位置不变。根据pm决定该轮循环是否进行变异操作,并随机选取变量进行变异,新粒子的位置更新公式为

式中:随机变量Y服从期望为0、方差为1的高斯分布,其概率密度函数为

若变异后子代适应度高于父代,粒子位置更新为子代位置,否则位置不变。GAPSO-SVM 算法中,将行驶工况识别精度作为适应度函数:

式中:n0为训练集中正确分类样本数;N0为训练集样本总数。GAPSO-SVM算法流程如图1所示。

图1 GAPSO-SVM算法流程

2 参数设置及仿真

使用现有的标准工况构建典型工况数据库,在MATLAB上完成GAPSO-SVM模型仿真,并使用该模型进行行驶工况识别。

2.1 行驶工况样本获取

根据不同工况的特点,选定城市、郊区、高速3类典型工况进行识别[10,13]。城市工况中红绿灯多,交通流量相对较大,偶尔会出现道路拥堵的情况,车速偏低;郊区工况中车辆能够保持一定速度稳定行驶,与城市工况相比怠速及停车情况更少;高速工况中速度较高且整体波动较小,几乎不存在拥堵情况。选取各国发布的标准轻型车行驶工况进行裁剪拼接,为避免过拟合,将每个标准行驶工况分别选取80%和20%构成训练数据和测试数据,使用标准行驶工况WLTP 低速部分、NYCC、USA_CITY_II、UDDS 构成城市工况;WLTP 中速部分、ARTEMIS_ROAD、USA_CITY_I 构成郊区工况;WLTP 高速及超高速部分、USA_FTP_HIGHWAY、ARTEMIS_MOTORWAY 构成高速工况,对数据拼接处做平滑处理[14]。拼接后的3 类工况训练数据见图2a,3类工况测试数据见图2b。

图2 不同工况数据

考虑到拼接后每类工况的总时长不同,使用随机数法抽取样本。实验时取连续数据片段120 s构成1 组样本,从每类行驶工况的训练数据中抽取160组样本构成训练集,从每类行驶工况的测试数据中抽取40组样本构成测试集,共计600组样本。各样本的初始时刻为

式中:α为(0,1)的随机数;T为某类工况数据的总时长;ΔT为样本片段时长,取120 s。

2.2 特征提取及预处理

行驶工况的特征值反应了不同工况的特点,根据文献[10,15],尽可能多地考虑特征参数选取,综合分析选取最大速度、平均速度、平均加/减速度、最大加/减速度、平均运行速度、速度标准偏差、加速度标准偏差、匀/加/减速比例作为特征参数。通过计算得到每组样本的12 个特征参数,为了统一特征参数的数量级,将特征值进行归一化处理:

式中:Xmax、Xmin分别为样本中特征值X的最大值与最小值。车辆行驶过程中特征值会随着工况的变化而变化,且特征参数之间存在一定关系,若考虑所有特征参数进行行驶工况识别会降低识别准确率。因此使用主成分分析法对特征参数进行预处理,主成分贡献率及累计贡献率见表1。

表1 主成分贡献率及累积贡献率

根据文献[16],累计贡献率达到80%以上且特征值大于1的主成分包含大部分信息。由表1可知前4个主成分的累计贡献率为88.9021%,已超过80%,且前4个主成分的特征值均大于1,因此选取前4个主成分进行得分计算,根据排名选取最大速度、平均速度、平均加速度、平均减速度作为后续的识别模型输入参数。

2.3 基于GAPSO-SVM模型的行驶工况识别

行驶工况识别仿真使用K-CV-SVM、PSOSVM和GAPSO-SVM分别进行模型训练,再进行识别准确率对比。使用的行驶工况识别方法流程图如图3所示。

图3 行驶工况识别方法流程图

使用K-CV 对参数C和g进行网格寻优时,最优参数值为识别准确率最高时对应的参数值,设置C、g取以2为底的离散值,范围为

根据文献[17-19]选取3 组参数组合,分别标记为P1(ω=0.7298、c1=c2=1.49618)、P2(ω=0.6、c1=c2=1.7)、P3(ω=0.4、c1=c2=2)。最大迭代次数为100,种群数量为40,重复实验10次,取实验平均值作为识别结果。PSO 和GAPSO 在3 组参数组合下的实验结果如图4 所示。由图4 可知,3 组参数对识别精度的影响都在1%内,并且GAPSO的识别精度都高于PSO,PSO 和GAPSO 在参数组合P2下均达到最高,因此选定P2组合作为后续实验参数。

图4 不同参数下PSO与GAPSO的识别精度

使用PSO模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c1、c2分别为1.7;使用GAPSO 模型进行参数寻优时,设置最大迭代次数为100,种群数量为40,ω为0.6,c1、c2分别为1.7,Pm、Pc分别为0.3 和0.7。GAPSO 法寻优过程见图5。3 种模型的训练结果对比见表2。使用GAPSO-SVM模型的训练集最优识别精度分别比KCV-SVM和PSO-SVM模型高出1.04%和0.21%。

图5 GAPSO寻优过程

表2 训练结果对比

3 仿真结果分析

测试样本共120组,城市工况、郊区工况、高速工况各40组,重复实验20次,取实验平均值作为识别结果,3 种模型的测试集识别结果见表3。使用K-CV-SVM、PSO-SVM 和GAPSO-SVM 的识别精度分别为78.79%、81.75%和84.38%,使用GAPSOSVM 模型的总识别精度相较于K-CV-SVM、PSOSVM分别提升了5.59%、2.63%。3种模型对测试集的郊区工况识别错误率最高,同时GAPSO-SVM模型的各工况识别精度要高于其他2种模型。

表3 不同算法的测试集工况识别精度

文献[15]中采用PSO-SVM 算法进行识别,测试样本识别率可达93.125%。若采用文献[15]的样本获取方法,文中提出的GAPSO-SVM算法的识别率可达到97.5%。在样本获取阶段直接采用随机数法进行样本抽取,训练样本和测试样本重叠,识别过程中存在过拟合问题,导致识别率偏高。因此,文中提前划分了训练数据和测试数据,分别在训练数据和测试数据中获取样本。

4 结论

利用现有标准工况构建3类典型工况,对不同类别的工况进行特征参数提取,并使用归一化、主成分分析进行数据预处理。建立GAPSO-SVM 识别模型,并在MATLAB 上进行仿真实验。在测试集上分别用K-CV-SVM、PSO-SVM、GAPSO-SVM模型对比识别精度,实验结果表明,GAPSO-SVM模型的识别精度分别比K-CV-SVM、PSO-SVM 高出5.59%、2.63%。由于各地区的道路交通规则不同,车辆行驶过程中行驶工况会受路况影响,后续研究将实际采集车辆行驶工况进行模型训练,并结合路况信息对识别结果进行修正。

猜你喜欢

超平面特征参数粒子
一种改进的多分类孪生支持向量机
基于视频图像序列的船用雷达目标检测和目标特征参数提取
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
基于非线性核的SVM模型可视化策略
有限维Banach空间中完备集的构造
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
基于膜计算粒子群优化的FastSLAM算法改进
Conduit necrosis following esophagectomy:An up-to-date literature review
问:超对称是什么?
基于最大间隔的决策树归纳算法