APP下载

新能源公交车辆大数据决策支持平台的研究

2017-06-05陈兴强唐可陈岳川周静赵宇杨振国

城市公共交通 2017年3期
关键词:决策分析数据仓库电动汽车

陈兴强唐 可陈岳川周 静赵 宇杨振国

(1.上海交通投资信息科技有限公司,上海 200000;2.同济大学电子信息与工程学院,同济 101102)

新能源公交车辆大数据决策支持平台的研究

陈兴强1唐 可2陈岳川1周 静1赵 宇1杨振国1

(1.上海交通投资信息科技有限公司,上海 200000;2.同济大学电子信息与工程学院,同济 101102)

新能源汽车具有能源利用效率高、环境污染小、适用清洁能源种类多、噪声低、方便保养、安全性高等优点,成为未来公共交通发展的重点方向。为了实现更高的信息化程度,为国内大型城市的新能源公交车辆的规模化应用提供便利,相关的信息化系统平台的建设非常重要。大数据技术为新能源公交车辆决策支持平台建立了数据分析与应用基础,该大数据决策支持平台能够存储、处理来自不同数据源的多维数据,利用联机分析处理实现多维度数据分析,运用数据挖掘技术利用新能源公交车辆信息,提供新能源车辆充电决策、充电场地建设决策、电池容量及衰退分析等功能。

新能源公交车辆;大数据技术;决策支持系统;车辆充电决策;电池容量分析

引言

随着新能源汽车技术逐渐成熟,越来越多的城市将公交优先和新能源车辆推广作为城市交通发展方向[1],城市中新能源公共汽车投放运营比例大幅上升,基础充电设施大量建成,由此产生了大量充电数据、运行数据、流量数据等。但是,相关的数据驱动平台仍然缺失,数据利用效率低下,组织结构不清晰,数据存储混乱,数据大量冗余,数据分析功能不足,无法提供更高层的决策分析功能。如何解决数据互通并从海量数据中获取对新能源汽车运行策略有用的信息是当前面临的重要难题。

决策支持系统的不断发展有效地提高了城市公交系统在决策环节的效率[2],同时减少了做出决策的资源消耗。决策支持系统,是以计算机技术、仿真技术为手段,针对半结构化的决策问题,支持决策活动的系统,能够为决策者提供数据、信息,帮助明确决策目标和进行问题的识别,提供决策模型以及方案,并对各种方案进行评价和筛选。决策支持系统需要几种相关技术的支持:数据仓库技术,数据仓库按主题组织数据库中的数据[3];联机分析处理技术,联机分析是基于数据仓库的决策分析系统中最常见的前端分析技术,支持复杂的分析操作,提供决策支持。联机分析处理以多维视图的方式展示给用户[4];数据挖掘技术,海量数据中隐藏的规律和数据间的联系需要通过数据挖掘的方法找出。主要任务包括概念描述、关联分析、分类与预测、聚类分析、演变分析和孤立点分析等[5]。常用方法包括统计分析方法、关联规则、聚类算法、神经网络、决策树、遗传算法、粗糙集[6]。

研究开发新能源汽车大数据决策支持平台是新型公共交通发展的需要,具有指导公共交通规划、提升公共交通效率、提升能源利用效率的作用。建立一个基于大数据的新能源公交车辆大数据决策支持平台显得必不可少。

1 大数据存储与挖掘技术

新能源车辆的充电数据体量巨大,类型繁多,要求实时性高(充电策略需要实时计算和提供给决策人员和调度人员),符合大数据的特征。

在本数据仓库中,数据源包含各种结构化和非结构化的数据,新能源车辆的充电数据来源车辆物联网、充电桩SCADA系统、各级电表、箱变等。数据包括:场站契约容量、场站功率因数、场站峰值用电、场站平时用电、场站谷时用电、400V读表数、箱变读表数、车辆路线、车号、车辆行驶公里数、充电时间、充电时长、充电度数等等。从数据源获取的数据经过分类、清洗转换等处理后存入数据仓库,作为决策分析系统的基础。

1.1 基于多维度的数据存储方式

充电数据是多维度的面向多类型数据源的数据系统,将所有数据按照结构化程度分为三类:

(1)来自充电桩SCADA系统的数据属于结构化数据,保存了各个充电现场的信息以及车辆的充电信息,可以直接装载到数据仓库中;

(2)车辆行驶数据属于半结构化数据,通常由人工记载、GPS定位记录等方式收集,形成路线、公里数、行驶时长等相关的文本或图像数据,需要进行预处理和预筛选,并对数据进行校正之后装载到数据仓库中;

(3)无结构的辅助数据,包括电价曲线、实时卫星数据(道路通行状态)、遥感数据等复杂格式的数据。

基于多维度的数据存储方式不同于传统的关系型数据库存储方式,采用数据立方体的方式管理与存储数据[7],同时以多维度显示与组织数据,采用在线联机分析处理(OLAP)的数据组织形式。OLAP提供数据的切片、切块、旋转和钻取等操作,以剖析数据为目标,能够从多个角度、多侧面观察多维结构中的数据。

1.2 分布式数据仓库模型设计

从各种数据源提取相关数据,建立分布式的数据仓库,在数据仓库的支持下进行数据挖掘,能够发现通过人工统计无法快速发现,甚至无法发现的信息,使得数据利用率上升,更好地支持充电决策的制定。

传统的数据仓库在单机模式下按照星型模型、雪花模型或星座模型组织数据[8],这种模式在海量数据状况下存在问题:数据转移代价高,数据迁移成本和执行连接代价大;无法快速响应新需求,当出现新的需求或更改已有需求时,传统数据仓库在从数据源到前段展现的整个过程中,都需要进行重新计算,这一处理周期是不可忍受的;对数据的处理效率低,传统数据仓库的数据操作在单节点上运行,无法适应数据容量增长的速度,成为处理海量数据的限制因素。

分布式的存储方式能够方便地进行横向扩展,能够满足海量数据的快速存储、计算要求。常见的商业云平台如Hadoop[9]、Spark开始被应用于搭建分布式的大数据平台。Hadoop开源云计算平台由HDFS分布式、MapReduce分布式平行计算框架和HBase分布式数据库组成,在大数据管理和分析等方面已经得到广泛应用,可以简化开发者任务。

1.3 MapReduce

MapReduce是谷歌推出的编程模型,能够在大量普通计算机上实现并行化处理。与数据仓库结合,将大的数据文件分割成小的数据文件,实现对数据的并行处理,可以提高数据处理效率。MapReduce框架主要包括两种服务器:独立的主服务器以及从服务器。主服务器负责任务调度,将任务交给从服务器,并进行监控[10]。

MapReduce的执行过程包括:将输入的数据切分给不同的机器机型处理;执行Map任务的机器解析数据、转化为中间形式;对中间形式进行排序、合并;将不同的结果集分给不同的机器,执行Reduce计算;得到输出结果。 一个典型的MapReduce框架如图1所示。

图1 MapReduce基本框架

MapReduce框架具有以下三个特点:

(1)可靠性。对数据集的大规模操作被分发到网络上的各个节点,每个节点计算完成后返回结果,若一个节点失效,主节点会将该节点的工作重新分配给其他节点。

(2)高效性。采用并行分布式的计算方式,工作被有效地分配到不同节点上,降低对节点性能的依赖,同时提升了效率。

(3)扩展性。系统可以在不影响现有业务的情况下增加资源,提高了灵活性。

2 系统架构

基于大数据的新能源公交车辆充电决策分析平台分为四层,分别是来源层、数据层、逻辑层和表现层。层次结构如图2所示。

图2 大数据决策分析系统架构

2.1 来源层

决策分析系统的底层是来源层,是构建决策支持系统数据仓库的基础。来源层包括车辆物联网、充电桩系统以及其他数据源的车辆运行信息、充电信息、交通流量信息等。

2.2 数据层

该层采用数据仓库的数据集成方法,从来源层获取的数据经过三个步骤:抽取数据、数据转换和数据装载。这三个步骤确定从哪个系统获取什么数据,确保数据的完整性和一致性,将处理完成的数据存储到数据仓库中,并处理装载完成后的汇集工作,构造面向多源的更高粒度的数据集市。

2.3 逻辑层

逻辑层是决策支持系统的核心,按照实际使用需求,使用多维数据分析、数据挖掘等算法。支持动态分析报表对数据进行旋转、切片和分层,用以帮助用户从各个角度对数据进行分析和比较。提供常用分析模型,提高系统通用性和灵活性。当遇到复杂的、新型的决策需求时,从数据层抽取特定数据建立面向主题的数据集市。

2.4 表现层

将下层各个业务的处理结果进行集成、处理,提供给用户。使得用户可以通过浏览器、客户端、移动端等终端进行访问。

3 决策支持策略

新能源电动汽车大数据决策支持平台的核心业务是提供新能源车辆运行决策,涉及故障分析、充电桩使用率分析、平谷峰分析、工作双休对比分析、年度契约负荷分析、月额度使用分析、每百公里电耗分析等,通过趋势、状态数据分析、时间日志等,利用运行控制图、范围控制图,形成日常管理数据指导和行业技术决策支撑。

该新能源公交车辆大数据决策平台主要包括三个方面的决策分析:

3.1 智能充电调度

智能充电调度目的是提高电网的综合效率,增加电力在交通能源领域中的利用,最大程度的节约成本。智能充电调度主要有基于电网系统的优化和基于交通状况的优化[11]。当大量电动汽车同时接入电网进行充电时,会加大电网负荷,造成电网电压偏离和电网损失等问题。基于交通状况的优化减少电动车辆的转移成本,同时降低交通路网负荷。单独对考虑电网系统的优化或者考虑交通状况的优化都是不够的。

综合考虑电动汽车续航里程长短、充电时长、充电设施位置的因素,设计电动汽车充电调度策略流程如下:

(1)初始化电动汽车状态和道路交通路网状态:初始化续航里程、电池容量、充电功率、道路拥堵率、充电站负荷等信息,设立路径搜索过程中的权值。

(2)充电路径规划:计算车辆状况、交通状况的权值,搜索综合权值最小的充电路径集合。

(3)查询充电站负荷:判断目标充电站电压是否过载、是否超出最大容纳车辆,如果目标充电站无法支持更多充电车辆,排除该充电站。

(4)判断电动汽车能否顺利到达充电站:判断充电站是否处于电动汽车剩余里程范围内。

(5)预测电动汽车充电时间、预测路网流量:预估状态改变,更新系统状态。

充电调度流程如图3所示。

图3 充电调度流程图

3.2 停车站规划

电动汽车充电站的规划要同时考虑充电场站的建设运营成本和社会效益[12],以及充电站接入电网系统后对系统的影响,是个典型的多目标决策优化问题。通过分析电动公交车的总体需求量,城市区域交通流量以及充电设施的布局和运营模式[13],建立最小目标函数,监控以充电桩的建设及管理费用、电动公交车驶向充电桩时间和充电等待时间。以充电桩的最小布局,电动公交车的最小流量、电动公交车距最近充电场所距离以及充电时间限制为约束条件[14],将整个城市区域网格化,在网格化的结构中选择部分网格区域作为充电桩场所,并为每个充电场所分配特定数量的充电桩。

3.3 电池寿命及容量衰减

新能源公交车辆的电池通常采用锂电池,锂电池的衰退模式有复杂的过程,可以用物理模型描述,包括电极、电解液、电解质等参数[15]。在不同的充放电状态下,电池寿命和容量衰减差别巨大。传统的电池寿命以及容量衰减的研究方式是研究锂电池的内部反应模式,包括电极与流体,电解液、电极与电解质等接触面之间的反应,在使用过程中无法检测内部变化。在不同的使用模式、运行状态下,电池的寿命以及容量衰减曲线是不同的,但是相同、相似的模式下电池容量的衰退是一致的。利用该大数据决策分析平台记录下的每次新能源公交车辆充放电过程和电池使用记录,对不同使用模式下的寿命和容量衰退模式进行聚类,可以有针对性的预测电池的寿命和容量衰减。

根据电池状态聚类结果,统计电池的充放电过程以及使用过程,建立多个电池状态类别,然后采用隐马尔科夫模型建立电池衰退模型[16]:

(1)确立电池衰退点,即电池何时进入衰退状态。

(2)设定状态数量,即电池衰退模式数量。对电池各种使用模式进行聚类分析,将电池的使用模式聚类为衰退模式。

(3)设定状态转移矩阵。根据记录的每次充放电模式,通过状态转移矩阵计算状态转移的概率。

(4)设定初始状态,根据不同电池的具体状态设定初始状态。

根据隐马尔科夫推导公式即可计算系统状态参数,预测指定电池寿命与容量衰减过程。

4 结语

随着新能源时代的到来,以及大数据技术的发展,为城市发展带来了革命性的机遇。新能源公交车辆大数据决策分析平台是实现智能化公共交通管理的重要工具。大数据决策分析平台的关键是分布式数据存储策略以及面向不同任务的数据挖掘策略,在此基础上形成决策分析系统模型。本文实现了一个分布式的大数据决策分析平台,并针对新能源公交车使用场景,研究了电动汽车的智能充电策略、停车场站设置方法以及电池容量和衰退预测方法,为新能源公交车辆决策平台提供了技术支持。

[1] Gong H, Wang M Q, Wang H. New energy vehicles in China: policies, demonstration, and progress[J]. Mitigation and Adaptation Strategies for Global Change, 2013, 18(2): 207-228.

[2] A review and an empirical test: Sharda R, Barr S H, MCDonnell J C. Decision support system effectiveness: a review and an empirical test[J]. Management science, 1988, 34(2): 139-159.

[3] Devlin B, Cote L D. Data warehouse: from architecture to implementation[M]. Addison-Wesley Longman Publishing Co., Inc., 1996.

[4] 刘让国. 数据仓库技术在交通信息系统中的应用研究[D]. 中国科学院研究生院(沈阳计算技术研究所),2007.

[5] 王成. 基于数据仓库和数据挖掘技术的温室决策支持系统[J]. 农业工程学报, 2008, 24(11):169-171.

[6] 孙彦超. 基于大数据的高校决策分析系统的构建[J].计算机光盘软件与应用, 2014(15):108-110.

[7] 李建中. 一种数据仓库的多维数据模型[J]. 软件学报,2000, 11(7):908-917.

[8] 陈景. 基于棉花仓储的数据仓库构建及可视化技术研究[D]. 首都师范大学, 2014.

[9] Shvachko K, Kuang H, Radia S, et al. The hadoop distributed file system[C]//2010 IEEE 26th symposium on mass storage systems and technologies (MSST). IEEE, 2010: 1-10.

[10] Simplified data processing on large clusters: Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM, 2008, 51(1): 107-113.

[11] 万爽. 面向交通和电网综合优化的电动汽车充/换电调度[D]. 北京林业大学, 2015.

[12] 葛少云. 电动汽车充电站规划布局与选址方案的优化方法[J]. 中国电力, 2012,45(11).

[13] 王辉. 电动汽车充电站规划与运营研究[D]. 浙江大学, 2013.

[14] 田文奇. 电动汽车换电站有序充电调度策略研究[J].电力系统保护与控 制, 2012(21):114-119.

[15] 戴海峰. 电动汽车用动力锂离子电池寿命问题研究综述[J]. 电源技术, 2014, 38(10):1952-1954.

[16] Eddy S R. Hidden markov models[J]. Current opinion in structural biology, 1996, 6(3): 361-365.

Research on decision support platform for big data of new energy buses

(1.Shanghai traff i c investment Mdt InfoTech Ltd, Shanghai 200000;
2. School of Electronic and Information Engineering, Tongji University, Tongji 101102) Chen Xingqiang1Tang Ke2Chen Yuechuan1Zhou Jing1Zhao Yu1Yang Zhenguo1

The new energy buses have the advantages of high energy eff i ciency, low environmental pollution, rich varieties of clean energy, less noise, convenient maintenance, high security, and become the focus of future development of public transport. In order to achieve a higher degree of I informatization and the large-scale application of new energy buses in the domestic cities, facilitating the construction of the information system platform is very important. Big data technology can provide the foundation of data analysis and processing for a new energy vehicle decision support platform, which can store and process multidimensional data from different data source, use on-line analytical processing to fi nish multi dimension data analysis, use data mining technology to utilize new energy buses information, provide charging decision, charging facilities construction and function analysis of the battery capacity decline.

new energy buses, big data technology, decision support system, charging strategy, capacity of battery research

U649.13∶U469.72

A

猜你喜欢

决策分析数据仓库电动汽车
纯电动汽车学习入门(二)——纯电动汽车概述(下)
基于数据仓库的数据倾斜解决方案研究
基于数据仓库的住房城乡建设信息系统整合研究
电动汽车
赛博作战辅助决策分析框架设计
当前军事决策分析关注的几个问题
探析电力系统调度中数据仓库技术的应用
现在可以入手的电动汽车
基于数据仓库的数据分析探索与实践
专注:电动汽车背后的技术创新