APP下载

城市道路汽车行驶工况的构建

2020-10-21朱彤

汽车实用技术 2020年11期
关键词:预处理特征提取

朱彤

摘 要:汽车行驶工况是汽车各项性能指标进行标定优化时的主要基准。文章根据某城市实时采集的乘用车数据,在对数据进行预处理的基础上,基于K均值聚类分析法对汽车运动学片段曲线的特征极值进行划分,利用运动学片段间的“亲疏程度”筛选出汽车行驶工况的候选片段,从而构建出一条最贴合该城市内车辆实际运行情况的行驶工况曲线。

关键词:汽车行驶工况;预处理;特征提取;K均值聚类分析

中图分类号:U467  文献标识码:A  文章编号:1671-7988(2020)11-250-04

Abstract: Driving cycle is the main benchmark for the calibration and optimization of vehicle performance indicators. Based on the real-time collected passenger car data of a city, on the basis of preprocessing the data, this paper divides the feature extremum of the kinematic segment curve of the vehicle based on the K-means clustering analysis method, and selects the candidate segments of the vehicle driving conditions by using the "affinity degree" between the kinematic segments, so as to build a driving cycle mode that fits the actual operation of the vehicle in the city best.

Keywords: Driving cycle; Preprocessing; Feature extraction; K-means clustering analysis

CLC NO.: U467  Document Code: A  Article ID: 1671-7988(2020)11-250-04

前言

汽车行驶工况又称车辆测试循环,它本是用汽车在一定时间段内(一般时间范围为1800s)的行驶时速度-时间曲线图。因其能体现出汽车在道路行驶时的运动学特征,所以成为车辆能耗/排放测试方法和限值标准的基础,更是汽车各项性能指标标定优化时的主要基准。

本世纪以来,我国汽车行业相关技术标准多以引用国外标准为主,而行驶工况采用的是欧洲的NEDC行驶工况[1]。随着经濟的快速发展,我国汽车保有量迅速上升,国内城市的交通状况发生很大改变,原先采用的NEDC行驶工况标准已经开始不适应新时代的交通状况。汽车行驶工况作为汽车行业创新开发、指标评价的重要基础依据,本身就具有极高的深入研究价值,而我国由于社会发展差异化及国情的特殊性,对汽车行驶工况普遍特征的总结和特殊特征的深度挖掘更存在着迫切需要。

本文利用某城市实时采集的同一辆轻型汽车实际行驶数据(采样频率1Hz),搭建了一个符合城市道路情况的汽车行驶工况模型。在经过对离散数据的插值拟合与不良数据的剔除后,划分提取出符合实际运动特性的运动学片段,然后基于运动学片段分析法、主成分分析法对实测汽车数据进行降维,经模式识别提取运动学片段曲线的特征极值。

在此基础上,基于K均值聚类分析法对汽车运动学片段曲线的特征极值进行划分,利用运动学片段间的“亲疏程度”筛选出汽车行驶工况的候选片段,从而构建出一条最贴合该城市内车辆实际运行情况的行驶工况曲线。

1 数据预处理

在汽车行驶工况的构建过程中,由于传输信号不稳定、电磁干扰、解码错误等各种原因会不可避免地导致所采集数据的质量严重下降。为提高数据质量,同时确保研究结果的可信度,本文使用MATLAB软件对原始数据进行预处理工作。

(1)数据转换

为了将给定的日期字符串(date)转换为日期数字(Time),实现对时间项的处理,使用MATLAB软件中的自带函数datenum按照如下格式进行强制转换:

(1)

(2)数据过滤

由于直接记录的原始数据中存在一定的误差,本文根据不良数据的结构类型进行分析、归纳后分批次处理。对于离散数据进行拟合插值,对异常数据进行修正迭代,对于非正常状态数据进行剔除。

2 模型构建

在数据预处理的基础上可以实现将行驶工况的数据划分为运动学片段,并经多次筛选出不同数量的特征参数做为主成分分析,最终本文选出11个特征参数进行研究,这11个特征参数具体展示如表1所示。

2.1 主成分分析法

主成分分析(PCA)于1901年被Pearson第一次提出,主要用于处理多维数据。其在数学上的常规处理是将原始n个指标做线性组合,作为新的综合指标[2]。

以是否收敛作为判别标准,本文中K均值聚类算法的分析过程中应设立2个聚类中心,此时运动学片段经迭代后其结果为收敛(当聚类中心的数目设为3时,运动学片段经迭代后的结果呈发散状态),因此本文选取的聚类中心数为2。

3 汽车工况曲线的拟合

通过运动学片段的迭代,本文选取10个距离聚类中心最近的运动学片段,使用MATLAB软件将总共20个运动学片段中最具代表性的数据特征結合在一起,构建一个具有普适刻画特征的汽车行驶工况曲线。总时长为2180s的汽车行驶工况展示如下图(1):

本文以平均速度(km/h)、平均行驶速度(km/h)等特征参数为指标构建汽车运动特征评估体系,计算出了汽车行驶工况与该城市所采集数据的各指标值特征参数差异率的对比,如表(6)所示。

由表(6)可以发现:汽车行驶工况与实测数据在平均加减速度、最大加速度、最大减速度速度标准差及加速度标准差上误差较小,在平均速度和平均行驶速度上存在较大误差,这是由于汽车运动时长的不同导致的,因而可以被忽略。

4 结论

正确、合理的数据预处理是下一步信息提取的前提和基础保证,针对原始数据存在的问题以及后期提取运动学片段信息的需要,本文使用MATLAB软件对原始数据进行预处理,通过编写程序完成数据的读取、转换、筛查及计算分析等操作,主要包括数据转换和数据过滤两部分,并最终给出各文件原始数据经过处理后的记录数。

本文以所得数据为例,将大量行驶工况的数据划分为运动学片段,并经过多次筛选不同数量的特征参数做为主成分分析,最终选出11个特征参数进行研究。首先用主成分分析法对运动学片段进行降维处理,然后接着利用K均值聚类技术对其进行分类,根据片段之间的“亲疏程度”作出筛选,在构建出一条具有代表性的行驶工况曲线的同时形成一个完善的汽车运动特征评价体系。

本次利用城市汽车行驶数据进行行驶工况的构建研究中,使用的模型可靠便捷,所构建曲线与实际工况吻合程度较高,在保证计算准确度的同时具有一定的科学价值,可以为后续的研究提供良好思路。

参考文献

[1] 石敏.轻型汽车行驶工况构建的研究[D].天津理工大学,2014.

[2] 陆璇.实用多元统计分析(第四版)[M].北京:清华大学出版社,2001.

[3] 石琴,郑与波,姜平.基于运动学片段的城市道路行驶工况的研究[J].汽车工程, 2011, 33(3):256-261.

[4] 范金城,梅长林.数据分析[M].北京:科学出版社,2002.

[5] Lin J, Niemeier D A.Exploratory analysis comparing a stochastic driving cycle to California's regulatory cycle[J].Atmospheric Envi -ronment, 2002,36(38):5759-5770.

[6] 姜平,石琴,陈无畏,黄志鹏.基于小波分析的城市道路行驶工况构建的研究[J].汽车工程, 2011(1):70-73.

猜你喜欢

预处理特征提取
菌剂预处理秸秆与牛粪混合对厌氧发酵产气的影响
手术器械预处理在手术室的应用
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
种养废弃物预处理技术可行性分析与实践
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别
液化天然气技术及其应用探析
碱预处理提高香蕉茎秆厌氧消化产气性能的研究
浅谈C语言中预处理