APP下载

水利数据中心资源开发与应用研究

2014-02-10刘汉刚

水利信息化 2014年2期
关键词:数据中心山东省水利

刘汉刚,李 光

(山东省水利信息中心,山东 济南 250014)

水利数据中心资源开发与应用研究

刘汉刚,李 光

(山东省水利信息中心,山东 济南 250014)

面临异构环境、业务融合、管理规范等非常复杂的问题,以及水利数据中心建设的现实需求,山东省水利厅按照国家水利数据中心建设的基本技术要求,结合山东省实际情况,采用云计算、虚拟化、大数据、宽网络等新技术,初步建成水利数据中心;完善水利数据中心标准,建立统一规范的技术基础平台和数据中心业务流程;构建数据中心应用服务平台,建设以水利数据中心为核心的水利信息资源共享环境与服务体系;实现各类水利数据信息的汇集存储与交换共享。

水利数据中心;云计算;虚拟化;大数据;应用服务平台;资源共享

0 引言

近几年,水利信息化建设快速发展,作用日益显著。水利信息资源开发利用取得了一定成效,数字化程度不断提高,自动化采集和传输能力日益增强,支撑主要业务应用的一些数据库基本建成。水利信息资源内容覆盖水利业务的方方面面,在防汛抗旱、水资源管理、农村水利、水土保持、电子政务等工作中发挥了重要作用。但是,目前水利信息资源开发利用程度不高、技术条件差异大、发展不平衡、异构现象严重,特别是围绕单一业务应用建设的数据库不能适应业务协同与功能提升等突出问题,严重制约了水利信息化的健康发展。因此,建设以山东省水利数据中心为核心的水利信息资源共享环境与服务体系,提升水利管理能力和现代化水平,推进水利从粗放管理向精细管理、从传统管理模式向现代管理模式转变,支撑和保障民生水利发展,满足全山东省对水利信息资源的需求,是十分必要和迫切的。

1 水利数据中心的建设目标

1.1 存在问题

山东省水利信息化建设在取得巨大进展并发挥显著效益的同时,也存在着一些不容忽视的问题。概括起来主要是以下 3 个方面:

1)没有统一的数据资源环境。长期以来,由于水利信息化建设的项目实施方式,使得水利信息化综合体系的数据资源被纵向(地域)横向(业务部门)切成了若干碎片,没有形成统一的数据资源环境,数据库交叉重复建设,信息不能充分共享。

2)没有统一的应用服务平台。这也就使得已建、在建乃至将建的各业务系统缺乏统一的技术架构,在逻辑上难以成为一个有机的整体,难以实现数据和软硬件资源的有效共享。

各部门按自身业务需要建立的应用系统,缺乏统一规划和标准,形成许多“信息孤岛”,如图 1 所示。

图1 信息系统孤岛

上级部门向下推广应用,缺乏统一规划和标准,形成许多纵强横弱的“信息烟囱”,如图 2 所示。

3)场地和基础运行设施问题。目前山东省水利信息系统基础硬件资源存在资源利用率低,不利于资源共享和绿色节能;运行和管理风险高,工作效率低;升级和迁移的难度高;业务系统可靠性低等问题和挑战。

图2 信息系统烟囱

1.2 建设目标

山东省水利数据中心是水利数据采集、传输、计算和存储的中心,是山东省“金水工程”建设规划(2011—2015)的核心任务,是实现水利信息资源整合、业务应用系统集成的基础性工程,它关系到“金水工程”建设目标能否实现,是实现水利“信息化”向“智慧化”发展的必由之路。山东省水利数据中心建设目标如下:

按照国家水利数据中心建设的统一部署和技术标准,以山东省水利信息化标准体系建设为基础,以云计算概念为指导,运用数据库、网络存储、数据备份、虚拟化等技术,采用整合、新建等方式,建设省、流域、市三级数据中心和重点数据库,初步形成全省水利信息资源共享环境与服务体系,实现各类水利数据信息的汇集存储与交换共享。

1.3 整体框架

山东省水利数据中心工程建设的总体框架由5 个层面、3 大保障体系、5 类服务对象共同构成。其中 5 个层面包括基础支撑层、数据资源层、应用支撑层、业务应用层、应用交互层;3 大保障体系包括标准规范、数据中心安全和运行维护等保障体系;5 类服务对象包括水行政主管部门、科研规划设计中介机构、社会公众、管理对象和政府相关职能部门等,总体结构如图 3 所示。

图3 水利数据中心总体结构图

2 水利数据中心资源深度应用分析

山东省水利数据中心建设内容包括基本运行环境,数据中心数据存储、交换与服务系统,以及安全、备份、技术标准及其它基础工作 3 大部分,总体框架图如图 4 所示。

图4 水利数据中心总体框架图

1)建设技术规范和管理办法。根据数据中心建设与运维管理的需要,在水利部下发的《水利数据中心建设指导意见和基本技术要求》的框架内,结合山东省水利信息化现有相关工作基础,编制山东省水利数据中心技术规范、规章制度和管理办法。主要包括:水利信息分类和编码规范、水利信息传输与交换规范、数据质量控制规范、水利信息资源共享管理办法、数据中心应用服务规范、数据中心数据更新规范、数据中心运行维护管理办法等。

2)完善、优化数据中心运行环境。在充分整合、利用现有机房和设备的基础上,补充购置小型机、服务器集群、支撑软件、数据库/数据仓库平台系统软件、数据安全备份设施等,构成满足省水利数据中心需要的运行环境。

3)建设水利数据资源目录。编制山东省水利资源目录,形成统一管理的水利数据资源目录体系。数据资源目录内容完全覆盖数据中心建设的数据资源,并建立动态连接。

4)整合数据资源。按照“一数一源”的原则,在充分利用和整合现有数据库信息资源的基础上,对数据资料进行收集整编,建设基础和专业数据库,并将水利普查、电子政务、防汛抗旱、农村饮水安全、灌区等数据整合到数据中心 ODS(操作型数据存储)区。

5)建设数据仓库与元数据库。选择防汛抗旱、农村饮水安全、实时水雨情、水资源等数据库中有时间点特性的数据,建设 Master 库(主数据库)和数据集市(主题数据库),初步建立基于数据专业模型关系的数据仓库,开展深度挖掘与分析应用。

在遵循相关元数据标准的基础上,设计开发涵盖数据中心全局的元数据库系统,实现基于元数据的数据管理。

6)构建数据中心应用服务平台。包括应用支撑、资源管理、基础服务等 3 个层次,扩充、完善平台资源与服务功能,整合部分数据资源和应用系统,形成基于统一技术架构的数据中心业务开发与运行支撑环境,面向各类应用系统提供基础服务和通用的应用服务功能,实现信息资源共享和业务协同。

其中,资源管理层主要提供的服务包括统一的数据访问接口、抽取、字典服务等;基础服务层主要提供数据查询、数据交换服务、消息服务、目录服务、服务管理、用户管理和安全服务等;应用支撑层主要包含与业务应用紧密相关的各类服务,提供的服务包括空间信息、数据分析、数据展现和告警等服务。

7)建立综合信息服务系统。建设面向山东省水利厅各业务处室的综合信息服务系统,提供数据发布、数据共享与交换、综合信息展示、数据挖掘与分析及专题服务等顶层应用服务。

8)建设数据中心管理与维护机制。建立多层次信息维护机制,按照现行的水利系统管理体制建立信息维护制度,促进信息维护制度建立。

统一设计开发数据中心数据维护与管理系统,支持数据的分级录入和更新,实现“省级牵头、分级建设、多层维护、全面受益”的目标,并提供元数据、数据资源目录等的管理维护功能。

建立综合监控系统,对数据交换与集成的流程及数据中心的软硬件环境进行监视,实时查看各单位的数据交换情况,并定期向全省水利行业通报各单位的数据共享落实和推进情况。

9)构建数据中心信息安全保障体系。按照《信息系统安全等级保护基本要求》,结合已有建设基础,从安全技术与管理 2 个层面,完善山东省水利数据中心的安全体系建设。

10)系统集成。在系统软硬件多个层次上对系统各部分进行集成,并整合利用水利厅通信网络、软硬件平台及机房环境等资源,通过有机连接和优化调整,形成最合理、高效、安全的数据中心软硬环境和运行使用基础。

3 基于整合和虚拟的数据中心资源应用

1)制定标准规范,保障资源整合顺利进行。结合山东省水利数据中心项目建设的实际需要,拟定编制了水利数据中心资源整合及其应用的部分技术规范和管理办法,主要有水利信息分类和编码规范、水利信息传输与交换规范、数据质量控制规范、水利数据资源共享管理办法、数据中心应用服务规范、数据中心数据更新规范、数据中心运行维护管理办法、水利元数据管理规范,用以保障资源整合及其应用的顺利进行。

2)硬件虚拟化实现了硬件资源的统一管理,提高了硬件资源的使用效率。山东省水利数据中心采用 VMware vSphere 虚拟化平台,构建了基于多台服务器的虚拟化系统。vSphere ESXi 把多台服务器的CPU、内存、存储等资源进行抽象化处理,整合成一个共享的资源池,物理资源被以虚拟资源的形式分配到各个虚拟机,提供硬件资源的标准化服务,提高了硬件资源的使用效率,降低了数据中心的能源消耗。山东省水利数据中心的建设主要将虚拟化技术运用在服务器、网络和存储等方面,采用服务器和网络虚拟化等技术进行水利数据中心服务器、网络和存储的虚拟化,完成了水利数据中心原有服务器的整合和迁移,实现了硬件资源的统一管理和按需分配,提升了水利数据中心的服务能力。

3)虚拟化技术帮助数据中心提供统一的应用服务平台,提升水利数据中心的服务能力。通过数据中心应用服务平台建设,采用虚拟化技术提供资源管理、基础服务、应用支撑等不同层面的服务,建立起一个合理、开放和标准、统一的应用支撑平台,为跨地域、部门、平台的不同应用系统,不同数据库之间的互联互通,以及实现“松耦合”结构的应用和数据集成奠定基础。此平台不仅能够满足目前数据中心的要求,还能实现未来业务发展对数据中心提出的要求,并且具有较好的扩展性,能够随着业务的发展和技术的更新日趋完善。

4)提供统一的数据资源环境,实现数据资源共建共享。通过按照统一技术标准和规范对全省水利信息数据进行收集、整合,梳理了现有水利业务系统数据,整理系统 1 008 张数据表,并对其分类、标准化,建成水利资源目录,形成了水利概况、水网工程、水资源、农村水利、水文信息、防汛抗旱、水土保持、电子政务、水库移民等 9 个专题,并对这些数据进行集中统一、安全可靠的存储与管理,构建统一的数据资源环境,为全省水利及相关部门提供可靠的数据资源,达到数据共建、共享的目的。

5)采用统一的信息接入标准和共享机制,建立业务支撑环境和数据交换共享体系。按照统一的信息接入标准和共享机制,建设应用服务平台、数据交换和共享体系,框架图如图 5 所示。具有面向全省水利系统、各级水利部门、上级机构、社会公众提供数据共享与交换,数据发布,数据查询与展示等服务功能,实现了水利业务系统服务复用、信息共享共用,实现了信息资源、应用功能和服务整合,避免了水利业务系统低水平重复建设,改善了各自为政的状况。

图5 水利应用服务平台、数据交换和共享体系框架图

6)采用大数据的管理模式,实现水利信息的深度数据挖掘。主要对水文、电子政务、水利普查和农村饮水安全业务等数据进行深度挖掘,从数据库、数据仓库中自动分析数据,进行归纳性推理,从中发掘出潜在的模式或产生联想,建立新的业务模型,帮助决策者调整策略,做出正确的决策。

4 水利数据中心建设经验与体会

1)严格按照水利信息化顶层设计要求,结合实际需求进行高标准规划。水利信息化顶层设计,是领域(行业)信息化工作中的一项有益探索,在解决资源共享与业务协同等方面,具有极为特殊的技术意义和管理作用。在水利信息化推进过程中,有序、有效地进行项层设计成果的维护,确保水利信息化的科学发展至关重要。而且,在顶层设计的基础上开展整体实施方案的设计,以及水利云、大数据和虚拟化技术的研究,具有极高的社会效益。

2)重视数据中心建设,成立专门领导协调组织。水利数据中心建设是水利部门基础性建设工作,需要各部门的大力配合共同开展,因此,成立以一把手为组长、分管领导为组员的水利数据中心领导小组,组织开展数据中心的各项协调和建设工作,可以极大保证项目的顺利进行。

3)结合本地实际情况,拓展建设思路。各地水利信息化程度不一致,各部门水利信息化水平参差不齐,水利数据中心涉及面极广,工作难度极大,应当紧密结合已建系统的实际情况,注重建设思路拓展,采用不同建设思路选择实用、可靠的技术实现,适度采用新技术提升系统水平。

4)依托技术支撑单位的专业技术人员全过程参与数据中心的建设。水利数据中心项目建设不同于其他行业的数据中心建设,系统涉及部门多、业务广、流程复杂、差异大,因此应选择有技术和人才实力的长年专门从事水利信息化建设的技术公司,参与项目的整个环节和建设过程,为数据中心的建设和后续运行维护提供基础保障。

5)技术先进性和水利信息化水平相统一,框架可扩展和水利信息化发展趋势相统一。在水利数据中心项目的建设过程中,贴近山东省水利信息化建设的实际需求,提出采取硬件虚拟化、基础设施云(Iaas),结合应用服务平台,实现基础设施按需分配、动态扩充,水利服务重复利用相互共享。下一步将实现水利信息监测信息物联网,打造山东智慧水利平台。

5 水利数据中心建设应考虑的因素

1)数据来源问题。长期以来,由于各部门水利信息化系统的建设各自为政,数据库交叉重复建设,可用度低,入库数据量小,信息不能充分共享,数据更新和安全得不到有效保障。随着业务应用需求的提高,围绕单一业务应用需求建设的数据库不能适应提升的需求,并反过来制约信息化发展的问题日益严重。

2)信息系统与数据中心对接问题。水利信息化系统建设在水利行业内,各个部门独立建设情况较为突出,缺乏统筹考虑,同时,信息部门对业务科室的信息化指导、协调不足,在数据整合、系统对接中存在推脱现象。实时雨水情、基础水文数据标准较为完善,但是在农村水利、水库移民等方面存在缺失,河流代码和水利普查编码等存在不一致。因此,增加了水利数据整合的难度。

3)水利业务系统类型繁杂,水利信息量大类多。水利数据中心项目的建设过程中,涉及到各类水利业务系统,涵盖了业务类、行政办公类、档案类、采集类等,水利信息涉及标准和非标准、电子和纸质、结构化和非结构化等数据类型。对每一类数据处理,几乎都不能借鉴先前工作,工作量十分大。

4)业务应用系统建设不同步,部分水利数据尚未纳入统一管理。水利业务系统建设不少,但是水利信息在部分科室还存在没有开展的情况,因此造成相应水利主题所需数据缺失。

5)水利信息编码规范缺失。在水利数据中心建设数据仓库过程中,存在部分水利 OLAP(联机分析处理)模型维度码表缺失国家、行业标准,因此,需要根据实际情况加以补充。

6)系统复杂多样,整合技术难度高。系统集成复杂,涉及到 C/S,B/S 架构,不同平台 C#,PB,Java,同时考虑将来建设系统和地市系统集成问题。对系统提供的服务需要分门别类进行分析,完成无状态服务转换。因此,系统集成设计技术多、难度高。

7)系统涉及业务部门多,项目协调组织困难。水利数据中心建设是由信息中心具体实施的,缺乏领导牵头协调,导致建设拖延。

6 结语

山东省水利数据中心项目的建设,总体上将遵循“统筹规划、统一标准,突出重点、分步实施,整合资源、信息共享,加强管理、保证安全”的建设原则,在山东省水利厅信息化建设领导小组的统一领导下,综合考虑各方面的实际情况,制定科学合理、切实可行的水利数据中心系统信息化建设目标,包括分阶段目标,统一进行工程的规划设计,建立统一规范的技术基础平台和数据中心业务流程,在工程实施过程中严格遵循相关标准,综合考虑人力、物力、资金等多方面因素,根据数据中心工作的需要,把总体目标具体分解为若干阶段性任务,合理安排运筹,集中力量解决不同阶段的重要问题,充分利用以往信息化建设积累的可用资源,并按照工程总体设计实现新旧资源的整合,增加相互之间的兼容性,实现不同系统和软件的优势互补,根据新的要求进一步拓展、完善和提升应用系统的功能与质量,逐步实现水利数据中心总体目标。

[1]水利部水利信息中心.全国水利信息化发展“十二五”规划[R]. 北京:水利部水利信息中心,2000: 1.

[2]山东省水利厅. 山东水利金水工程(2011—2015)建设规划[R]. 济南:山东省水利厅信息中心,2011: 4-9.

[3]山东省水利厅. 山东省水利数据中心一期工程实施方案[R]. 济南:山东省水利厅信息中心,2011: 75-76.

[4]徐成龙,樊杰. 面向服务的领域分析方法的研究[J]. 计算机与现代化,2013 (2): 69-70.

[5]焦锋. 一种领域软件集成系统的设计技术[J]. 小型微型计算机系统,2010 (9): 1770-1777.

[6]王晓燕,刘淑芬,张俊. 一种基于领域模型和构件组合的软件开发框架[J]. 电子学报,2009 (3): 540-545.

[7]周惠群,左春,蔡玉宝. 特定领域的数据参考模型建模方法研究[J]. 计算机工程与设计,2009 (3): 605-609.

Research on Resource Development and Application of Water Resources Data Center

LIU Hangang, LI Guang
(Shandong Provincial Water Resources Information Center, Jinan 250014, China)

Faced with very complex issues as heterogeneous environments, business integration, management standard, as well as the practical needs of the water resources data center construction, according to the basic requirements of the national water resources data center, combined with the actual situation of Shandong province, water resources department of Shandong province adopts new technologies like cloud computing, virtualization, big data technology, wide network, initially builds water resources data centre. It improves water resources data center standard and establishes a standardized technology platform and a unified data center business processes. It builds the data center application services platform and constructs water resources information sharing environment and service system with water resource data center as its core. It realizes pooling storage and exchange sharing of all kinds of water resources data information.

water reources data center; cloud computing; virtualization; big data; application service platform; resource sharing

TP393

A

1674-9405(2014)02-0024-06

2013-10-11

刘汉刚(1964-),男,山东招远人,研究员,研究方向:水利信息化建设与管理。

猜你喜欢

数据中心山东省水利
酒泉云计算大数据中心
山东省交通运输研究会正式成立
RCEP对山东省高质量对外开放的影响
眷 恋
——山东省济宁市老年大学之歌
浅析数据中心空调节能发展趋势
为夺取双胜利提供坚实水利保障(Ⅱ)
为夺取双胜利提供坚实水利保障(Ⅰ)
水利工会
水利监督
关于建立“格萨尔文献数据中心”的初步构想