APP下载

基于GA- FCM 和SVM 的城市快速路交通状态判别方法研究

2020-05-12王峥

科学技术创新 2020年10期
关键词:交通流遗传算法种群

王峥

(苏州科技大学,江苏 苏州212200)

1 概述

准确划分城市快速路交通状态能为交通信息发布与服务水平评价提供重要依据,国内外学者提出了许多有效的交通状态判别方法,其中机器学习算法因其强大的性能得到广泛关注。

聚类分析方法能够在没有任何先验标签数据的基础上对交通流数据进行分类。董红召等[1]对交通流数据进行模糊聚类,定量分析交通路网的状态,在此基础上分析路网密度,对城市道路状态进行实时判别。钱超等[2]应用FCM算法将交通状态划分为四个类别,并利用蒙特卡洛模拟法对聚类精度进行评价。杨庆芳等[3]以高速公路收费依据为基础建立FCM算法模型判别交通状态。

经典有监督学习算法支持向量机(SVM)和人工神经网络(ANN)也被广泛运用到交通状态判别当中。于荣,王国祥等[4]对比了SVM三种核函数在交通状态分类中的优劣性,并提出在数据预处理时归一化的必要性。李清泉,高德荃等[5]结合模糊理论和SVM建立了模糊SVM模型用于交通状态分类。董春娇,邵春福等[6]建立了一种基于优化SVM的城市快速路交通状态判别方法。李晓斌,徐建闽等[7]利用RBF 神经网络建立了交通状态判别模型。巫威眺,靳文舟等[8]提出了基于BP 神经网络的交通状态判别模型。

上述文献为城市快速路交通状态判别提供了理论基础,但大部分的文献都只是单纯使用聚类或者分类,入手角度单一,由于数据量大且参数维度高,如果不对参数进行预处理就容易造成运算量大程序运行时间过长或分类结果不精准等情况,因此本文运用先聚类后分类的策略,构建了基于GA-FCM的交通状态聚类模型,先对大量数据进行聚类预处理后,再使用SVM进行交通状态分类使之更容易找到分类边界,提高数据处理效率和分类准确度。

2 基于GA-FCM 和SVM 的判别方法

2.1 模糊C 均值算法和遗传算法存在的问题

FCM采用梯度下降法寻找最优解,这种计算方法收敛速度快,但存在着对初始化敏感与容易陷入局部最优解等问题。上述缺点导致模糊C 均值应用于交通流状态划分时可能无法给出正确的聚类结果。

遗传算法(GA)[9]是一类借鉴生物界的进化规律演化而来的随机化搜索方法。在函数求解、参数寻优方面性能强悍,已被广泛运用到各个领域。考虑到FCM可能会陷入局部最优,本文凭借遗传算法优秀的全局搜索能力对FCM进行优化。尽管遗传算法能够实现全局优化,但其本身也存在一定的缺陷。采用二进制进行染色体的编码可能会带来字符串长度、计算精度、运算量等一系列问题。

2.2 基于遗传算法的FCM算法

针对上文的不足,提出一种基于遗传算法的模糊聚类,采用实数进行编码,然后进行交叉、变异,最后再结合FCM 算法进行聚类分析。该算法首先使用优化的遗传算法得到全局最优解的近似解,然后把近似解作为FCM算法的初始值,最后再用FCM 算法求解得到全局最优解[10]。

编码:采用实数(实值)编码策略,简化了编码过程,提高了算法的收敛速度和全局搜索能力。将C 个聚类中心组成一个染色体,每个聚类中心有S 个特征值,则编码长度为C*S。染色体的编码表示形式为:p11p12…pc1pc2…cs。

选择:

①计算所有个体适应度,找出适应度最高的个体复制到下一代;

交叉:采用单点交叉,随机产生交叉点并交换两父体右半部分产生新个体。

变异:在初始交叉概率的基础上增加了一个权值ω=1-f/fmax,个体的变异概率为ω*Pm,fmax表示种群中的最大适应度,Pm为变异概率。

2.3 基于GA-FCM和SVM建立的交通状态判别模型

步骤1:编码并初始化种群,确定三参数的上下界,分别在三参数上下界中生成3 个随机数作为1 个初始聚类中心,本文聚类数为4,故执行4 次生成四个聚类中心。将四个随机生成的初始聚类中心按实数编码组成一个染色体。

步骤2:确定种群规模,对种群中按步骤一操作生成的染色体进行适应度评价后进行选择、交叉、变异生成新种群,满足终止条件后结束遗传算法。

步骤3:将遗传算法得到的聚类中心矩阵作为FCM的初始值带入FCM计算。并输出最终的聚类中心。

步骤4:将聚类过后的4 类数据分别打上标签,划分测试集和训练集,选择SVM核函数和确定参数值后进行训练。

步骤5:分别使用网格搜索法、粒子群算法、遗传算法对SVM参数值进行优化,确定最优参数组后使用测试集对模型进行测试。

3 模型验证

本文选取上海市某城市快速路路段检测器提供的2017 年8 月19 日24 小时的交通路参数(流量、速度、占有率),采集间隔时间为1 分钟,共1440 组。

3.1 聚类结果

根据交通流运行特性并参考中国道路服务四个等级,采用基于改进遗传算法的模糊聚类将交通状态划分为四类。

算法基本参数:种群数量n=50,最大进化代数T=100,遗传概率Pc=0.7,变异概率pm=0.1,聚类中心数目n=4,模糊系数m=2,最大迭代次数100,类内距离ε=1*10-5。

4 种交通状态的聚类中心矩阵:

第一至四行分别代表拥堵、拥挤、平稳、通畅4 种不同的交通状态。其中第一类样本271 个,第二类样本367 个,第三类样本378 个,第四类样本424 个。各类交通状态参数空间分布如图1 所示。

图1 交通状态聚类结果图

算法收敛图像如图2 所示。

由于遗传算法的全局搜索性能优秀,经过遗传算法优化得到的FCM目标函数初始值已接近FCM目标函数的极值,将此初始值带入FCM算法求解迭代公式,由图可以看到FCM算法迭代10 次以内已经收敛收敛,说明改进过的算法收敛能力强,比单纯使用FCM效果好。

图2 GA-FCM 与FCM 算法收敛曲线对比图

3.2 多分类支持向量机状态判别

利用基于遗传算法的模糊聚类将1440 组交通流参数分成了四类,为确保支持向量机分类的准确性随机抽取40%的标签数据作为测试集,60%的标签数据作为训练集。

粒子群算法参数设定:局部搜索能力和全局搜索能力参数c1=1.5,c2=1.7,最大进化数量200,最大种群数量20,速率关系参数0.6,速率弹性系数1,种群弹性系数1,搜索范围C∈[0.1,100],g∈[0.1,100]交叉验证次数v=3,C=0.5172,g=0.01 时分类效果最优97.7431%。优化过程如图3 所示。

图3 粒子群算法迭代适应度曲线

遗传算法参数设定:最大进化代数T=100,最大种群数量N=20,交叉概率Pc=0.95,变异概率Pm=0.1,搜索范围C∈[0,100],g∈[0,100] 交 叉 验 证 次 数v=10,当C=0.96292,g=0.0038147 时分类准确率最优为98.6111%。优化结果过程图4 所示。

通过3 种参数寻优方法比较,最终确定最优参数组合C=0.96292,g=0.0038147。通过选取的最优参数组合对剩余的576 组标签数据进行测试,准确率达98.6111%,共错误分类8个样本,其中第一类误判2 个样本,第二类误判3 个样本,第三类误判1 个样本,第四类分类误判2 个样本。

图4 遗传算法迭代适应度曲线

4 结论

本文结合了FCM和SVM的优势,构建了基于模糊聚类和支持向量机的交通状态判别模型。首先通过基于改进遗传算法的模糊聚类将交通流参数划分成四类,分别代表四种交通状态,并将数据打上标签;然后划分测试集和训练集,通过支持向量机进行训练集分类,并使用网格搜索法、粒子群算法、遗传算法进行参数对寻优得到最佳参数组合,最后将最优参数组合用于测试集,实验结果表明模型性能良好,判别准确率可达98.6111%,判别准确率较高。

猜你喜欢

交通流遗传算法种群
基于LSTM的沪渝高速公路短时交通流预测研究
山西省发现刺五加种群分布
京德高速交通流时空特性数字孪生系统
基于双种群CSO算法重构的含DG配网故障恢复
基于遗传算法的高精度事故重建与损伤分析
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于ANFIS混合模型的短时交通流预测①
基于遗传算法的智能交通灯控制研究
由种群增长率反向分析种群数量的变化
基于改进多岛遗传算法的动力总成悬置系统优化设计