APP下载

电动汽车充电用户行为特征研究

2018-06-22李雪梅段晨悦许鑫傅军孙志杰周国鹏

中国市场 2018年13期
关键词:充电站聚类分析

李雪梅 段晨悦 许鑫 傅军 孙志杰 周国鹏

[摘 要]通过充电交易数据发现电动车用户的行为特征比较困难,但这些特征对于充电站运营企业提高运维服务质量至关重要。文章使用K-means聚类模型对2016年10月至2017年9月冀北地区充电站交易数据进行了研究,发现了3类用户:高速一级用户、高速二级用户和城市用户;在此基础上,进一步钻取出5类用户:跨城办公用户、游玩用户、过路用户、城市居民用户、北京办公用户。根据这些用户特征,提出了相应的运营策略、充电站规划建设建议。

[关键词]充电站;用户行为特征;聚类分析

[DOI]10.13939/j.cnki.zgsc.2018.13.125

1 引 言

充电站作为电动汽车充电基础设施,与电动汽车为互补产品。在国家“十三五”规划关于电动汽车充电基础设施需要建设适度超前、车桩相随、智能高效的充电网络体系的精神指导下,电动汽车充电站覆盖面积不断扩张、充电站用户也越来越多。正确识别充电站用户或电动汽车用户的行为特征,对于运营企业提高运营效率、提升运维服务质量、引导用户充电行为,都具有重要意义。

目前,国内关于电动汽车用户行为特征的研究较少。李跃(2013)和王飞龙等(2013)在研究充电站的需求预测中,将电动汽车用户分为规律性较强的A类用户、规律性一般的B类用户、随机性的C类用户,其依据主要看电动车是否为公交车或私家车。[1-2]邢龙等(2013)研究电动汽车参与的微网运行优化中,将用户分为及时充电、低价充电和双向充放电三种模式,其依据是电动汽车剩余量的多少。[3]陈丽丹等(2015)在研究电动汽车充电负荷预测中,将用户按照出行目的划分为回家、工作、购物吃饭、社交休闲和其他事务五大类。[4]陈静鹏等(2016)研究电动汽车充电站优化规划模型,也使用了类似的分类。[5]这些研究虽然不是专门研究用户特征,但是,从侧面反映出用户行为特征在相关领域研究中所起的重要作用。

国外关于电动车用户充电行为特征的研究也比较少。Xydas等(2016)研究了英国电动车充电需求的特征,集中在充电电量方面。[6]Speidel等(2014)研究了澳大利亚西部电动汽车的充电模式,主要考虑充电时段、电动车剩余电量等方面的因素。[7]Bi等(2016、2017)通过考虑电动车行程和充电剩余电量门限研究了新加坡电动车的充电行为。[8-9]这些研究涉及充电需求,但没有涉及用户本身。

国内外其他相关研究基本上集中在充电站布局选址、充电站负荷、充电站营运模式、电动车产业政策等方面。本文将使用冀北公司已运行充电桩的相关数据,对电动车充电用户的行为特征进行研究,从用户标签出发提出相关建议,为其他领域的研究奠定基础。

2 数据处理与研究方法

充电用户行为特征研究主要依赖于从车联网管理平台提取的数据,其中包括充电桩档案、冀北地区充电交易数据等。这些数据一般只涉及用户的充电卡号、充电电量、交易金额、交易方式、交易时间、交易桩号,欠缺用户准确的描述。如何从现有数据抓取用户特征依赖于正确研究方法的选择。抓取用户特征本质上就是对用户进行分类,在数据分析技术中聚类分析是最为有效的分类工具。聚类分析是一组模型、工具,使用这组工具可以将数据目标分成若干类。由于车联网平台数据相对较大,我们选择K-means模型进行聚类。

K-means模型的使用对数据结构有一定要求,但从车联网平台提取的数据结构性较差。因此,需要结合业务知识,对原数据进行整理和预处理,得到格式统一的、数据完整的和标准化的电动汽车用户相关的结构数据。

2.1 数据处理

数据处理将原数据从业务角度转换成K-means模型可以使用的格式。这包括代表性处理、业务处理、K-means处理。

代表性处理:电动车用户充电行为主要群体是大众,公交充电不具有代表性,因此,將2016年10月1日至2017年9月30日冀北交易数据中公交充电站交易数据剔除。

业务处理:按照运营企业业务需要,将站点分为北京相关高速、城际高速、承德市站点、廊坊市站点、唐山市站点、秦皇岛市站点、张家口市站点7类;将交易时段划分为0—3:59、4—7:59、8—11:59、12—15:59、16—19:59、20—23:59 6个时段;将交易日期划分为工作日、周末、节日3种。

K-means模型聚类,要求变量为数值型。因此除了卡号识别用户作为观测单位之外,充电交易数据中,高速、城市站充电次数;工作日、周末、节日充电次数;一天各时间段充电次数;各类别充电站的充电次数等都为数值型。

通过上述数据处理,得到20个变量反映充电用户的特征,这些变量的数据结构可以用K-means模型聚类计算。

2.2 K-means模型

K-means聚类模型由MacQueen(1967)提出后,从算法、工具方面得到很大发展。[10-11]尤其在处理大数据方面表现出比系统聚类的优势更受欢迎。聚类模型的两个基本步骤是:选择相似性度量、选择并类算法。K-means聚类的相似性度量主要依据欧氏距离,也就是需要不断计算观测单位与每个类均值的距离。如果观测单位包含p个变量,每个类的均值坐标计算公式如下:

x—i=1n∑nj=1xji (i=1,2,…,p)

其中n为这个类包含的观测单位个数,xji是观测单位j的第i个变量的观测。因此,这个类的均值为:

x—=(x—1,x—2,…,x—p)

观测单位j与这个类均值之间的距离就是xj=(xj1,xj2,…,xjp)和x—的欧氏距离,这也表示j和这个类的距离。

K-means聚类模型的并类算法选择如下:

Step 1:将观测单位划分成K个初始类。

Step 2:遍历观测单位列表,将每个观测单位分配到其最近的K个类当中的一个;重新计算类元素变化的类的均值。

Step 3:重复Step 2直到目标分配达到稳定为止。

其中Step 1可以随机划分K个类。Step 2计算每个观测单位与每个类的距离,然后,将其分配到最近的类。这种分配如果发生,必然导致某个类元素的减少,另一个类元素的增加。从而需要对变化的类重新计算类均值:

x—i,new=nx—i+xjin+1 (如果观测单位j分配到这个类)

x—i,new=nx—i-xjin-1 (如果观测单位j从这个类删除)

其中i=1,2,…,p为第i个变量,x—i为这个类原来第i个变量的均值,x—i,new为新的均值,n为这个类原来包含的观测单位数。Step 3将重复Step 2,直到形成K个最终的类。

对于用户特征的研究,观测单位为充电用户,或用户ID,共16012个。每个用户j都有共p=20个变量(见表1):Dl、Dc、Zg、Zs、Zb、Zc、Zj、Zl、Zq、Zt、Zz、Tg、Tz、Tj、T1、T2、T3、T4、T5、T6对应K-means模型中的xj1,xj2,…,xj20。

K-means聚类模型的并类算法可以通过大部分程序语言或软件包实现。

3 用户行为特征

下面的分析基于2016年10月至2017年9月冀北交易数据,经过数据的标准化处理,使用K-means模型对在冀北地区使用过充电桩的16012个用户进行聚类分析。K的设定以及最终应该产生多少类是任何聚类模型的一个难题。一个可行的方法是对给定的一组K的值进行实验,使得类中的元素个数相对比较平衡,结合专业知识来选择最终的类数。

3.1 初步K-means聚类结果

为了覆盖潜在的类数,我们对K=1至15进行K-means聚类分析,最终选择K=6的聚类结果,再进一步确定最终类数。K=6的聚类结果如表2。

从初步聚类结果来看,类别4、5、6包含的成员数只有1个或没有,对于这3个类别可以不去关注。因此,初步得到3个比较平衡的类别1、2、3。下面分别从高速使用、充电电量、充电次数、充电时间方面比较这3个类别。

由表3可知,第一、二类用户高速站充电使用较为频繁,第三类用户很少使用高速站充电。因此,初步定义这3个类别为高速一级用户、高速二级用户、城市用户。第一、三类用户的年人均充电电量远高于第二类用户。但三类用户的平均充电电量都比较显著、充电时间主要就集中在8:00—20:00,需要我们进一步关注。

第一类用户为高速一级用户,共有5497人,约占冀北用户群的34.33%,大部分用户高速使用率高且使用次数高。高速使用比高;充电电量及充电次数在三类用户中最高,微高于第三类用户。

第二类用户为高速二级用户,共有4769人,约占冀北用户群的29.78%,大部分用户高速使用率高,但使用次数低。高速使用比高;充电电量及充电次数在三类用户中最低,且远低于其他类用户。

第三类用户为城市用户,共有5744人,约占冀北用户群的35.87%,大部分用户高速使用率低,但使用次数高。高速使用比低,接近于0;充电电量及充电次数与第一类用户相似,微低于第一类用户。

从表4可以看出,高速一级用户工作日使用次数:周末使用次数:节日使用次数≈3.3∶2.0∶1;8—19:59时间段使用次数高;站点使用情况,北京相关高速远高于其他站类型。

高速二级用户工作日使用次数:周末使用次数:节日使用次数≈3.7∶2.3∶1;8—19:59时间段使用次数高;站点使用情况,北京相关高速远高于其他站类型。

城市用户工作日使用次数:周末使用次数:节日使用次数≈10.6∶4.9∶1;12—19:59时间段使用次数高;站点使用情况,廊坊市站点远高于其他站类型。

3.2 用户特征

通过上述研究,結合运维业务经验大致可以得到如下结果:

高速一级用户,多数为跨城办公用户。其充电行为的主要特征为在京津冀地区工作日充电电量较大且充电次数较多,充电站使用频繁人群,而且在北京相关站点、城际高速站点常有充电。

高速二级用户,多数为过路用户、游玩用户。其特征是充电量、充电次数不大,但充电的站点分布相对均匀、分散。

城市用户,基本上是城市居民用户、北京办公用户。其特点是工作日充电次数相对多,但充电站点不太均匀,且北京办公多集中于廊坊市燕郊地区站点充电。

4 建 议

根据上述研究,我们提出针对不同用户类型的运营策略建议。

高速一级用户:推出分段计价、套餐服务。这种策略可以通过分时段、分地段,或工作日节假日等多种形式的组合套餐,给用户提供一定程度的优惠,来更好地吸引用户,提高服务质量。

高速二级用户:推送附近景区信息、周边服务(餐饮等)、附近沿途充电站。这种策略从用户的兴趣点出发,不仅可以有效地服务用户,也可以和周边景区、其他服务业进行合作,发现新型服务模式。

城市用户:推送附近低频使用站点并给予优惠、推送新增站点情况。这种策略可以引导用户以优惠价格使用低频站点,尤其推荐一些附近新增站点。这不仅可以减少用户等候时间,也充分使用了充电网络资源。

增建城市站点:在充电高频的城市站点周围,增加充电站点。在整个充电网络系统中,各个站点的使用频数相差很大。比如,廊坊地区的站点使用次数远高于其他站点。这就需要在该地区的高频站点附近增设新站点,使得站点网络布局更加合理。

5 结 论

通过对冀北地区充电交易一手数据进行整理,借助于大数据技术的K-means聚类,我们发现了冀北地区充电用户行为的部分主要特征。根据不同用户的特征,为运维管理、规划建设提出相应建议。这些建议对于冀北,乃至京津冀电动车充电网络的发展具有一定的实际意义和应用价值。随着交易数据的不断完善、大数据技术的进一步改进,还有更珍贵的用户信息需要我们去挖掘。

參考文献:

[1]李跃.基于用户分类的电动汽车充电站需求预测[J].电气时代,2013(12):98-100.

[2]王飞龙,孙凯航,李燕青.基于用户分类的电动汽车充电站需求预测[J].黑龙江电力,2013(2):132-134.

[3]邢龙,张沛超.基于用户需求分类的电动汽车参与的微网运行优化[J].可再生能源,2013(5):46-50.

[4]陈丽丹,聂涌泉,钟庆.基于出行链的电动汽车充电负荷预测模型[J].电工技术学报,2015(4):216-225.

[5]陈静鹏,艾芊,肖斐.基于用户出行需求的电动汽车充电站规划[J].电力自动化设备,2016(6):34-39.

[6]Xydas,Erotokritos,Charalampos Marmaras, et al.A data-driven approach for characterising the charging demand of electric vehicles:A UK case study[J].Applied Energy,2016(162):763-771.

[7]Speidel, Stuart, Thomas Brunl.Driving and charging patterns of electric vehicles for energy usage[J].Renewable and Sustainable Energy Reviews,2014(40):97-110.

[8]BI, RAN,JIAJIAN Xiao,VAISAGH V,ALOIS K.Influence of charging behaviour given charging station placement at existing petrol stations and residential car park locations in singapore[J].Procedia Computer Science,2016(80):335-344.

[9]BI, RAN,JIAJIAN Xiao,VAISAGH V,ALOIS K.Influence of charging behaviour given charging infrastructure specification:A case study of Singapore[J].Journal of Computational Science,2017(20):118-128.

[10]MACQUEEN,JAMES B.Some methods for classification and analysis of multivariate observations[J].Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability,Berkeley,CA:University of California Press,1967:281-297.

[11]JOHNSON,RICHARD A,DEAN W W.Applied multivariate statistical analysis [M].New Jersey: Pearson Prentice Hall,2007.

猜你喜欢

充电站聚类分析
基于红外线热成像仪设备在蓄电池充电站中的应用
“首充”
地产人的知识充电站,房导云学堂5月开讲!
考虑充电电池组循环利用的集中充电站容量配置
一种电动汽车充电站监控终端的设计与实现