APP下载

基于新能源高频大数据的驾驶行为与能耗分析

2021-04-09夏丽娜何绍清康泽军王建斌贾国瑞

时代汽车 2021年6期
关键词:聚类算法主成分分析能耗

夏丽娜 何绍清 康泽军 王建斌 贾国瑞

摘 要:近年来,在新能源汽车示范推广和财政补贴的大背景下,我国新能源汽车产业快速发展。但与传统燃油车相比,新能源汽车的技术成熟度尚且不足,在研发、运行阶段仍存在诸多问题等待解决,其中能耗和续航问题的关注度尤为突出。本文基于车载终端采集到的新能源高频大数据,提取能够反映驾驶行为精细时空变化特征的特征参数集,采用主成分分析方法将特征参数集进行优化,利用K-means算法实现驾驶行为的自动分级,并分析了不同级别驾驶行为的能耗分布情况。分析结果表明,驾驶行为影响新能源汽车能耗水平,其中平稳驾驶对应的能耗较低,对新能源汽车产品升级和用户驾驶习惯优化具有一定的参考价值。

关键词:新能源高频大数据 驾驶行为 能耗 主成分分析 聚类算法

1 前言

在汽车产业“电动化、网络化、智能化、共享化”的趋势背景下,近年来新能源汽车产业快速发展。据统计显示,截止2020年6月,全国新能源汽车保有量已达417万。与传统燃油车不同,新能源汽车在运行过程中采集了大量运营数据,可一定程度上反映用户的使用习惯和新能源汽车的产品性能。利用新能源运营大数据进行挖掘分析,提升新能源汽车产品研发效率,针对性地优化产品性能,加快产品更新迭代节奏将是新能源汽车产业未来发展的大趋势。

目前,新能源汽车的技术成熟度尚不如传统燃油车,在研发及运行阶段还有诸多问题亟待深入研究,其中续航和能耗是车企和消费者最为关注的问题之一。新能源汽车能耗的高低,与用户驾驶行为密切相关。目前行业内对于驾驶行为的研究多基于低频数据提取车速、加速度、方向盘转角的统计学参数,用于评价驾驶行为的平稳性和安全性,不足以对驾驶行为的时空变化特性进行精细刻画,也无法为企业在研发端为产品优化提供参考价值。

本文基于新能源高频大数据,提取驾驶过程中的不同数据字段联合分布特征参数,以反映驾驶行为的时空变化特征,构建新能源汽车驾驶风格分类模型,研究不同驾驶风格的能耗分布,将有助于优化新能源汽车产品开发策略,促进新能源汽车正向发展。

2 新能源高频大数据及其分类

新能源高频大数据是通过车载终端设备采集得来,主要包括驾驶行为数据、充电数据、电池数据、电机数据、DCDC数据等,目前最高采集频率可到100Hz。

2.1 驾驶行为数据

驾驶行为数据主要包括加速踏板开度、制动踏板开度、方向盘转角、车速、行驶里程等。

2.2 充电数据

充电数据主要包括充电方式、充电状态、充电电流、SOC等。

2.3 电池数据

电池数据主要包括总电压、总电流、SOC、绝缘电阻、最高单体电压、最低单体电压、最高温度、最低温度等。

2.4 电机数据

电机数据主要包括电机控制器电流、驱动电机转速、驱动电机扭矩等。

2.5 DCDC数据

电机数据主要包括DCDC电压、DCDC电流、DCDC温度等。

3 驾驶行为分析

3.1 驾驶行为特征参数提取

通常,评价用户的驾驶行为可采用的数据主要为车速、方向盘转角、纵向加速度、制动减速度等,可提取的参数则包括最大值、最小值、均值、中值、众数、标准差以及不同区间占比等。

3.1.1 车速

车速不仅与道路安全密切相关,更是影响新能源汽车能耗的重要参数,无疑是评价用户驾驶行为必不可少的指标。除最大值、最小值、中值、均值、标准差等常规统计学参数外,不同车速区间的占比能够细化车速离散性,可反映出用户驾驶行为的平稳性。

3.1.2 方向盘转角

方向盘转角反映了用户对车辆的横向控制作用,而方向盘转速则能够表现出用户在驾驶过程中的操作行为。方向盘转速是指用户在单位时间内转动方向盘的角度,即

(1)

式中:为相邻两帧数据的方向盘转角变化量;t为相邻两帧数据的时间变化量。

3.1.3 纵向加速度和制动减速度

用户对于加速踏板和制动踏板的操作是驾驶行为的重要环节,具体表现在车辆的纵向加速度和制动减速度数据上。采集到的新能源高频大数据中,不包含纵向加速度和制动减速度数据字段,需通过车速和时间计算得来,即

(2)

式中:v为相邻两帧数据的车速变化量;t为相邻两帧数据的时间变化量。若加速度a计算值为正,则为纵向加速度,记为a+;若加速度a计算值为负,则为制动减速度,记为a-。

3.1.4 联合分布特征参数

与车速相同,纵向加速度、制动减速度和方向盘转速都可采用最大值、最小值、均值、标准差等统计学参数以及在不同区间的占比来反映其变化特征。但上述特征参数都只能基于时序信号对驾驶行为从整体进行表达,而忽略了车速与纵向加速度、制动减速度或方向盘转速的同时性,故无法刻画出用户的急加速、急减速、急转弯等重要细节。

为精细刻画用户驾驶行为,尤其是急加速、急减速、急转弯等不良操作,本文提出利用车速-纵向加速度、车速-制动减速度和车速-方向盘转速联合分布作为评价用户驾驶行为的指标。联合分布特征参数可从时序角度整体把控驾驶行为,也可反映出车速与纵向加速度、制动减速度或方向盘转速的空间关系,能够综合评价驾驶行为的时空变化特征。

3.2 驾驶行为特征参数优化

在用户的实际驾驶行程中,不能完全覆盖联合分布的每个区间范围,故驾驶行为的联合分布特征参数存在一定的冗余性。為最大限度降低计算所需的资源,同时最大化保留驾驶行为联合分布特征参数所蕴含的信息,需对特征参数进行降维优化。

主成分分析算法是目前成熟且常用的复杂数据矩阵降维方法之一,由Pearson在1901年首次提出。利用主成分分析算法,可对驾驶行为的联合分布特征参数进行正交变换,将相互之间可能存在一定关联性的驾驶行为联合分布特征参数矩阵,正交化成为一个线性化且互不相关的参数矩阵,其中每个参数即为一个主成分。通过对所有主成分的贡献率和累计贡献率进行分析,选取其中前若干个主成分,以反映原驾驶行为联合分布特征参数的80%以上的信息量。经过主成分分析,可大大减小原驾驶行为联合分布特征参数矩阵的维度,提高计算效率。

3.3 驾驶行为自动分类

目前行业内通常根据驾驶激烈程度,将驾驶行为分为激进型、普通型和温和型。本文将采用大数据挖掘技术中的聚类算法,基于驾驶行为的特征参数集,实现驾驶行为的智能化、客观化自动分类。

聚类算法根据数据特征参数集中各点相对聚类中心点的距离大小,确定特征参数的类别,是一种无监督学习算法,不需要在分类前对数据进行标签化处理。K-means算法原理简洁、计算高效,是目前应用最为广泛的聚类算法。

K-means算法根据用户给定的K值,从数据集中随机抽取K个点为聚类中心,计算数据集中其余数据点与K个聚类中心点的欧式距离,按照距离大小将其分配到与之欧式距离最小的聚类中心点,构成一类数据。利用K簇数据中各数据点的均值代替原聚类中心,重新进行数据点分类,迭代至不再重新分配数据点所属类别或聚类中心点不变或误差平方和达到局部最小。其中,欧式距离计算公式为

(3)

式中:d为数据点到聚类中心点的欧式距离;n为数据点的维度;xi为数据点特征参数;ki为聚类中心点特征参数。

其中,误差平方和是指数据集中所有数据点的聚类误差总和,可一定程度上反映出聚类效果,其计算公式为

(4)

式中:SSE为误差平方和;Ci为第i类数据;ki为Ci的聚类中心点;x为第i类数据集中的任意点。

4 驾驶行为能耗計算

能耗是反映新能源汽车能源消耗量的直接数据指标,是评价新能源汽车性能的重要参数。通过车载终端设备采集来的高频大数据中,不含有能耗字段,因此需要利用其他数据字段计算能耗。常用的能耗特征参数包括总能耗和百公里能耗,其中总能耗是指一段驾驶行程所消耗的总电量,而百公里能耗是结合行驶里程将总能耗归一化为每百公里消耗的电量。

总能耗的计算公式为

(5)

式中:Etotal为一段驾驶行程的总能耗;n为该段驾驶行程数据的总帧数;Ui为第i帧数据总电压;Ii为第i帧数据总电流;t为第i帧数据时间戳与第i-1帧数据时间戳之差。

百公里能耗的计算公式为

(6)

式中:E100为一段驾驶行程的百公里能耗;Etotal为该段驾驶行程的总能耗;d为该段驾驶的行程里程数。

5 案例研究

本文利用运营在天津的某品牌某款纯电动汽车采集新能源高频大数据,所选车辆上线日期接近,且运营在同一地域,降低了地域、电池寿命等因素对能耗的影响。

5.1 数据预处理

原始采集新能源高频大数据中存在部分空值、缺省值等无效数据片段,影响后续驾驶行为分析和能耗计算的精确度,需进行数据清洗处理。本文采用的处理方法是利用有效数据片段进行线性插值,替换无效数据片段。

原始数据按照时间戳先后顺序存储,其中包含充电工况数据和行驶工况数据,需从中筛选出行驶工况片段,用于驾驶行为分析。本文根据代表钥匙状态的数据字段Key_State来划分行驶工况,Key_State为“ON”,表示行驶工况开始;Key_State为“OFF”,表示行驶工况结束。

5.2 特征参数分析

注:车速单位(km/h)

注:方向盘转速单位(°/s)

注:纵向加速度单位(m/s2)

以驾驶员A的一次行驶和驾驶员B的一次行驶为例,分别提取其车速、方向盘转速、纵向加速度和制动减速度的各项统计学参数和不同区间占比,如表1~表4所示。

由表1可知,驾驶员A本次行驶除怠速外,车速在45~55km/h范围内分布占比较高,车速较为稳定;而驾驶员B本次行驶车速在10~70km/h范围内接近均匀分布,车速稳定性差。表2结果显示,驾驶过程中,小幅度方向盘转动占比达80%以上,驾驶员A方向盘转速大于10°/秒共占比14.85%,驾驶员B方向盘转速大于10°/秒占比18.3%,驾驶员B方向盘转速相对较快。利用表3分析可知,无论是纵向加速度高于0.75m/s2占比还是高于2m/s2的占比,驾驶员B都高于驾驶员A,故驾驶员A相对驾驶员B加速行为较为温和。同样,表4则反映出驾驶员A减速行为也相对温和。

为了更精细反映用户在驾驶过程中的行为特征,本文提取了车速-方向盘转速、车速-纵向加速度、车速-制动减速度联合分布特征,以上述驾驶员A和驾驶员B的两次行驶事件为例,其联合分布特征参数分别如图1~图3所示。

注:制动减速度单位(m/s2)

从图1可以看出,驾驶员A方向盘转速高于20°/s对应的车速多集中分布在30km/h以下,而驾驶员B对应的车速则集中在10~50km/h范围内,说明驾驶员B转弯时车速高于驾驶员A。由图2和图3可知,驾驶员B的车速-纵向加速度以及车速-制动减速度联合分布都较为分散,车速、纵向加速度和制动减速度都高于驾驶员A,驾驶较为激烈。

综上所述,用户的驾驶行为特征参数包括车速、方向盘转速、纵向加速度、制动减速度的各项统计学参数和区间占比以及三种不同联合分布特征,共383维。利用主成分算法对特征参数集进行分析,如图4所示,从中发现,前35个主成分的累计贡献率达到85%以上,可用于原特征参数集,实现特征参数集的优化降维,降低数据集的复杂度,提高计算效率。

5.3 驾驶行为分类

理论上讲,聚类数K值越大,分类更精确,然而在实际中,K值过大并不利于用户对真实数据的分类分析,因此需要首先确定最优聚类数K值。本文基于降维后的驾驶行为特征参数集,利用K-means聚类算法测试不同聚类数K值对于的聚类效果,如图5所示。当聚类数K值小于5时,误差平方和SSE急剧下降,说明随着K值的增大,聚类效果显著提高;当K值大于5时,误差平方和SSE下降趋势逐渐缓和,说明K值的增大对于聚类效果的提高效果不明显。因此,本文以5为最优聚类数,将驾驶行为划分为5类,如图6所示。

根据驾驶行为分类结果,分析图6中不同类别中行驶事件的特征参数发现,不同类别对应的车速-纵向加速度和车速-制动减速度有明显差异,能够反映驾驶行为的激烈程度,可将5类驾驶行为按照激烈程度由低至高进行排序,如图7所示。图7中,驾驶行为级别越高,其对应的车速、纵向加速度和制动减速度所能覆盖的区域越广,驾驶行为越激烈。

5.4 不同级别驾驶行为能耗分析

根据驾驶行为分级情况,对不同级别驾驶行为中所有行驶事件,利用式(6)计算百公里能耗,不同级别驾驶行为的能耗分布情况如图8所示。1级驾驶行为样本数为1708,百公里能耗众数为18.5度;2级驾驶行为样本数为1649,百公里能耗众数为15.7度;3级驾驶行为样本数为600,百公里能耗众数为16.6度;4级驾驶行为样本数为30,百公里能耗众数为22.8度;5级驾驶行为样本数为34,百公里能耗众数为21.4度。其中,4级和5级驾驶行为由于样本数较少,百公里能耗分析结果可信度降低。驾驶行为2级、3级车速稳定,驾驶较为温和,能耗相对较低;驾驶行为4级、5级车速較大且车速变化剧烈,能耗较高;驾驶行为1级,车速低,多为怠速事件,能耗居中。

6 结论

本文利用新能源高频大数据,基于车速、方向盘转速、纵向加速度和制动减速度提取了驾驶行为的常规统计学参数、不同区间占比以及不同数据联合分布等特征参数,采用主成分分析方法对特征参数集进行降维优化,利用K-means算法将驾驶行为从温和至激烈划分为5个级别,并探讨了不同驾驶行为级别对应的百公里能耗分布情况。结果表明,驾驶行为的激烈程度严重影响新能源汽车能耗,平稳驾驶相对节能,可为产品升级和用户驾驶提供一定指导建议。

课题1:广东省重点领域研发计划项目“燃料电池乘用车整车集成及动力系统平台开发”课题课题编号2019B090909001

课题2:中汽中心重点课题“基于大数据分析的动力电池安全预警模型与平台开发”

课题3:中汽中心青年基金课题“基于纯电动汽车高频大数据的能耗研究”

参考文献:

[1]孙川,吴超仲,褚端峰等. 基于车联网数据挖掘的营运车辆驾驶速度行为聚类研究[J]. 交通运输系统工程与信息,2015,15(6):82-87.

[2]文江辉,杨先敏,吴超仲. 大数据环境下营运车辆驾驶行为特征分析[J]. 交通信息与安全,2018,36(4):42-50.

[3]李岩,石柏军,张兆元等.基于行车数据的长途客车驾驶员驾驶行为识别方法研究[J].机械设计与制造工程,2017,46(12): 105-108.

[4]孙川.基于自然驾驶数据的车辆驾驶风险辨识及控制研究[D]. 武汉理工大学,2011.

[5]赵晓华,陈晨,伍毅平等. 出租车驾驶员驾驶行为对油耗的影响及潜力分析[J]. 交通运输系统工程与信息,2015,15(4):85-91.

[6]Zejian Deng,Duanfeng Chu,Chaozhong Wu,et al. Curve safe speed model considering driving behaviour questionnaire[J]. Transportation Research Part F: Psychology and Behaviou,2019,65:536-547.

[7]Faria MV,Baptista PC,Fariias TL. Identifying driving behaviour patterns and their impacts on fuel use[C]. 20th EURO-Working-Group-on-Transportation Meeting(EWGT):Budapest Univ Technol & Econ,2017(27):953-96.

[8]李平凡. 驾驶行为表征指标及分析方法研究[D]. 吉林大学,2010.

[9]Ying Yao,Xiaohua Zhoa,Chang Liu,et al. Fuel Consumption Prediction Method Based on Driving Behaviour Collected from Smartphones[J]. Journal of Transportation, 2020(11):1-11.

猜你喜欢

聚类算法主成分分析能耗
水下飞起滑翔机
气象参数对成都地区办公建筑能耗的影响及预测
K—Means聚类算法在MapReduce框架下的实现
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于改进的K_means算法在图像分割中的应用
大规模风电场集中接入对电力系统小干扰稳定的影响分析
上半年单位GDP能耗同比降4.2%