APP下载

信息孤岛解决之道——数据港口架构理论初探

2015-09-10夏艳波

中国管理信息化 2015年1期
关键词:孤岛港口标准

夏艳波,王 权

(大庆油田有限责任公司,黑龙江 大庆 163002)

1 困扰信息界的一个普遍问题

经过多年的信息化建设,社会各个领域已经建成十分庞大的数据体系和应用体系,然而由于建设初期往往缺乏长远的数据规划和应用规划,数据和应用的“孤岛问题”日趋严重。近些年来,经过规划和再次建设,问题有所缓解,孤岛数目可能减少了一些,但是回头我们看一下,我们又造成了更大的孤岛。

当今,业界人士尤其是奋战在一线的电子政务和企业信息化建设人士普遍认为,已经来临的“智能”时代的主题和重点,将不再是信息系统建设本身,而是“数据”的全面整合升级,是数据应用质量和效率的大幅提升。数据整合升级的重点就是解决数据的共享问题,难点就是整合逻辑上归属于已建各个应用系统的数据。

目前普遍在系统集成中遇到的现象就和最初航运遇到的问题一样。系统之间相互访问,其间的关系复杂密集成网。通过适配器等模式的点到点互访使整个巨系统变得越来越复杂,耦合程度越来越紧,系统负载越来越重。

在长期的信息系统应用建设和开发中发现,大部分数据供应用系统内部使用,只有一部分数据涉及与外部应用系统进行交互,就像贸易流通只涉及一部分商品一样。这些用于交互的数据才是关键。那么,我们通过建立一种机制解决这些数据的顺畅交互问题,也就解决了整个信息巨系统中的孤岛问题。

2 物流运输业两大变革的启示

早期由于货物运输的包装形状、大小各异,一大部分时间用于装卸和摆放,空间利用效率和运输效率十分低下。

美国货车司机马尔科姆·麦克莱恩,在1946年研制发明集装箱运输货物获得成功,后被广泛应用于汽车、铁路、轮船和飞机运输。此发明减少了货物在港口的滞留时间,将国际货物的运输效率提升了4~5倍,使得远洋贸易极大发展并产生了巨大的变革。集装箱的成功和广泛应用得益于它的标准化功能。

最早期的货物运输大多采用点到点的运输方式,运输线路纷繁复杂,效率和成本一度成为国际贸易的瓶颈。港口的出现,尤其是集装港口,缩短了各种贸易的运输时间和运输的路程,极大地提高了贸易往来的效率。现代化港口作为“物流中心”,其强大的集散功能带动了整个世界经济贸易的发展。

3 “自标准数据”及体系运行原则

通过类比,我们找到了信息世界的集装箱及其内装货物,即“自标准数据”。“自标准数据”是大庆油田早在1998年提出的,现已被业界广泛认可并处于深入研究发展之中。从其定义与体系运行原则来看,“自标准”的概念与货物运输业中广泛使用的集装箱极其类似。

自标准数据(Self-Standard Data,SSD)即自带标准或格式说明的数据体。

自标准是一套信息资源整合(IRI)的技术标准体系框架。包括数据自治域 (Data Autonomous Domain)的数据标准(Data Standards)、自治域之间数据交换标准(Data Exchange Standards)以及数据交换服务协议(Data Exchange Service Protocol)。其中,数据交换服务协议规定了自标准数据元数据获取方式和数据获取方式,为得到数据后按元数据(标准)识别、使用数据提供了依据。

自标准数据体系运行原则:开放、自治、简单和集中管理。

3.1 开放原则

包括标准开放、平台开放和技术开放等。具有开放性的思想和理论才具备可传播性、可操作性和广泛应用性。开放的系统能够容纳更大的业务和技术复杂度,易于传播和集成。

3.2 自治原则

自标准数据在一定的自治域内有效。数据自治域有别于特定的某一信息系统,是某一应用实体,如一个基层单位、一个部门、一个分公司甚至一个集团。只有这样,才能有效避免数据在语义上产生歧义而造成数据混乱。

3.3 简单原则

在复杂的应用场景中被广泛使用的规则必须具备简单性,太复杂的规则即使具有开放性也难以被广泛应用。简单规则可以让规则本身仅关注核心的部分。TCP/IP协议族最终战胜其他多种复杂协议成为当今互联网的基本协议,就是因为它本身并不复杂又能够恰到好处地解决网络的核心问题。

3.4 集中管理原则

虽然数据是分散、自治的,但要有数据集中统一管理机制。集中管理能够让分散的数据运作高效而统一。集中管理能够为分散的数据提供统一的资源寻址、目录检索、数据推送以及垃圾回收等服务。

4 数据港口运行机制

类比研究现实世界中的港口及其运行机制,提出 “数据港口”的概念。

“数据港口”(Data Harbor)是独立于现有信息系统之外,以“自标准数据”为交互单元,在数据提供者和数据交换者之间,提供数据集装、存储、解析和配送应用的一整套数据服务机制。多个数据港口之间具有互信和调度机制,并行完成整个数据体系的交互过程。

4.1 数据提供者(Supplier)和数据消费者(Consumer)

与港口交换数据的应用程序,根据交互方向不同,称之为数据提供者(Supplier)和数据消费者(Consumer)。

数据提供者将自标准数据提交到数据港口,数据消费者到数据港口按照数据的自标准解读并使用数据。

一个应用程序既可以是数据提供者,也可以是数据消费者,当然也可同时担当两种角色。

数据港口,数据供应者和数据消费者避免了直接交换数据,互相之间可以不必了解细节,只需按照港口的规则提交数据和获取数据即可。

图1 数据港口运行机制图

4.2 入港与出港

数据供应者和数据消费者通过港口提供的自标准SDK与数据港口进行交流。数据供应者将数据通过自标准SDK转变为自标准结构提交到港内,此过程为入港;数据消费者根据自标准结构解析出自己所需数据进行应用,此过程为出港。

4.3 港务管理

港内实现对各类数据资源、标准资源和服务资源的统一管理,包括数据解析、标准适配、安全认证等服务,完成港口调度、泊位管理和权限分配。

港口另外提供自标准数据目录索引和搜索引擎,以协助用户(程序)快速检索到所需数据资源。

4.4 数据码头

港内的数据码头根据数据的类型和匹配的自标准对数据完成封装、存储以及相关的管理任务。

各类不同的自标准数据根据需要将存放在不同的数据码头当中。

4.5 航道管理

一个应用实体(单位、公司、集团或政府部门)内可以存在多个数据港口。第一个创建的数据港口自动成为母港口,由母港口可以创建生成多个子港口。各港口与数据的自治域无关,数据的自治由各港口内部提供的机制完成。

母港口具有航道管理功能,负责管理多个子港口以及其他应用实体外部港口的港间互信连接以及数据交互协调工作。

5 应用实例

2013年底,“大庆油田生产经营管理辅助决策系统(DQMDS)”立项并开始研发。目标就是通过系统开发和集成,打破各应用系统界限,突破信息孤岛问题,建立统一生产经营管理办公平台,为大庆油田各级管理层和决策层提供管理依据和决策参考。

DQMDS系统功能涉及生产管理、经营管理和决策支持的各个领域,几乎涵盖了各级机关和管理人员的所有业务,通过工作门户、流程中心、数据中心和交流中心为用户(微机、平板电脑、手机终端)提供服务,目标用户总量达到5万余人,系统十分庞杂。DQMDS系统的底层数据大多来自已建系统,共涉及中石油统建系统59个、大庆油田自建系统85个。各个系统建设于不同时期,地理位置各自不同,采用的技术五花八门,数据库类型纷繁多样。项目组系统研发人员通过学习,将“自标准数据”思想和“数据港口”架构作为指导理论,圆满地解决了整个巨系统的数据交换与集成问题。现已完成系统前期设计,正在全力研发当中。

6 结束语

“数据港口”服务架构,作为众多信息系统间的数据交换中心,将自标准作为其间的“集装箱”使用,使整个系统关联变成了松耦合,系统之间关系和状态清晰可见,信息孤岛将无障碍联通,信息应用效率将大幅提升,信息化建设成本也将大幅下降。“自标准数据”和“数据港口”技术对于有效地解决企业内外多专业、多学科间复杂的数据交换、集成和共享问题具有深远意义,特别是对大数据交换也具有很好的应用价值。

本文针对解决“信息孤岛”问题所提出的“数据港口”概念及其运行机制,只是给出了基本架构思路,仅仅是初步的设想,可能还存在很多缺陷,还需要在实践中检验和不断完善,希望能够对从事这方面研究的专家、学者,以及从事企业和政务信息化实践的管理人员和技术人员有所启发。本文阐述的基本观点和内容是在大庆油田有限责任公司信息中心王权主任的启发和指导下形成的,在此深表谢意。

猜你喜欢

孤岛港口标准
聚焦港口国际化
中国港口,屹立东方
2022 年3 月实施的工程建设标准
不再是孤岛
港口上的笑脸
忠诚的标准
美还是丑?
没有人是一座孤岛
孤岛求生记
惠东港口