APP下载

长沙黄花综合保税区数据中台设计

2021-12-24张明磊彭鹏刘硕丰龙陈锋

电脑知识与技术 2021年29期
关键词:数据模型

张明磊 彭鹏 刘硕丰 龙陈锋

摘要:该文设计了一种适合长沙黄花综合保税区的数据中台,首次基于以共享为基础、以需求为导向的原则,通过构建数据共享交换、数据管控和数据服务模型,提出了一种数据分级治理模型,形成了数据资源池,建立了统一的保税区数据治理体系,构建了数据中台功能架构模型,实现了保税区数据业务系统的分级共享治理,推动了保税区业务数据共享开放。

关键词:数据中台;综合保税区;数据;模型

中图分类号:TP302.1;TP311.52    文献标识码:A

文章编号:1009-3044(2021)29-0001-03

A Data Middle Platform of the Changsha Huanghua Comprehensive Free Trade Zone

ZHANG Ming-lei2,PENG Peng1, LIU Shuo-feng1, LONG Chen-feng3*

(1. Changsha Comprehensive Insurance Investment Co. LTD, Changsha 410137, China;2. Department of Science and Technology, Changsha Customs District P.R China, Changsha 410000, China;3.School of Information Science & Technology, Hunan Agricultural University, Changsha 410128, China)

Abstract: A data Middle platform of the Changsha Huanghua comprehensive free trade zone is designed, which based on sharing, the principle of demand oriented, by building the data exchange, data control and data sharing service model, this paper proposes a data classification governance model, formed the data resources pool, the establishment of a unified data management system, the bonded area to build the function of data China architecture model, realize the free trade zone data service system of hierarchical Shared governance, Promoting the free trade area business data sharing and opening.

Key words: data middle platform; comprehensive free trade zone; data; model

1引言

長沙黄花综合保税区以产业为基础,以航空为依托,与黄花机场、长沙海关实现联动和无缝对接,实现保税区内的仓储、物流、商贸等以及配套的商务办公、会展、综合服务等功能。区内包括进口生鲜保税仓、保税研发港、高端装备加工区、医疗设备分拨中心、保税奢侈品店、基建设备展交中心、文化贸易保税园、智能装备产业园、电商总部基地、海关机场口岸等各种功能单位或机构。保税区内的单位、公司或机构涉及海量的各种异构数据,为保税区数据管理、分析和治理带来了极大挑战。

目前国内保税区都实现了信息化管理,推动了保税区的快速发展[1-3],但是数据维护工作量相当大,并且维护分散在区内管理部门、公司、海关等单位[4-7]。随着业务不断变化和创新,各单位都针对自己的业务在不同时间、不同阶段和不同需求等提出了新的要求,但是区内外各种数据尚未实现整体管理和治理,数据孤岛现象严重,各部门对数据严防死守,数据管理、分析和治理的响应力、效率、汇聚力等方面严重跟不上这些需求。为此,本文以保税区内的多源异构业务系统为数据源,基于数据分级治理体系,设计了一种适合长沙黄花保税区的数据中台。

2数据中台设计原理

2.1总体功能架构

通过对长沙黄花综合保税区内各部门、企业、海关等单位的各种异构业务系统的数据业务流程实地调查研究,结合保税区3D可视化运维管理数据实效性和特殊性,数据中台总体设计以共享为基础、以需求为导向的原则,将多源异构业务系统的数据进行汇聚和标准化处理,通过数据接入、数据处理、数据共享交换系统,加强数据管控和数据服务,形成统一的数据资源池,建立统一的保税区数据治理模型,对区内外提供统一的数据需求功能,丰富保税区主题库和专题库数据资源,提升保税区数据资产价值,打造保税区数据开放服务,总体架构如图1 所示。这种总体架构模式容易划分保税区内外各业务部门的大数据智能分析服务逻辑功能以及中台业务子功能模块。

2.2 数据分级治理模型

保税区的数据治理以数据应用为导向,贯穿于数据生命周期,通过数据元和业务逻辑规则的标准化管理,不断加强区内元数据、数据模型、主数据和数据安全等管理,从而持续提升和优化数据质量,为数据服务提供支撑。数据治理主要采用一级治理和二级治理联动的分级治理模式,包括技术治理与环境治理,具体数据治理模型如图2所示。

(1)数据接入。提供统一的数据汇聚业务功能,将保税区繁杂、各式多样的外部关联部门业务系统、内部业务系统等相关数据接入到数据治理模型,以便与其他系统进行数据交换,为上层大数据应用支撑平台的业务分析工作提供数据源。从保税区的数据来源分布来看,接入数据包括外部关联数据、感知数据和其它数据等,针对不同来源数据采用不同的数据接入方式,主要分为外部关联数据接入、感知数据接入和其他数据接入等方式。数据接入功能包括数据接入子系统提供数据探查、数据读取、数据对账、断点续传、任务管理和数据分发等。

(2)数据处理。针对已汇聚的结构化数据记录、半结构化文本等具体数据内容建立标准化的数据处理模式,并将处理后的数据存储在系统数据资源池中,实现了数据抽取、清洗、转换、去重、补全、关联、融合、比对、数标识等功能。处理方式分为从前置库到原始库、从原始库到资源库、从资源库到主题库、从主题库到专题库等4种。

2.3 数据共享交换模型

保税区内外需通过共享交换子模型完成与横向各硬件系统进行数据共享交换。数据共享交换模型由交换管理模块、接入管理模块、交换前置模块、交换传输模块、交换桥接模块、运行监控模块等部分组成,工作原理是通过交换桥接子系统将各转隶单位和综合保税区3D可视化运维管理平台相关数据部门需要交换的信息交换到前置交换信息库,并在交换管理子系统的流程控制下,通过交换桥接子系统和交换前置子系统把需要交换的信息定向传输到接收转隶单位和相关部门,从而把共享信息实时交换到共享交换库,如图3所示。

交换管理子系统支持对整个信息共享交换子系统的综合管理监控,包括交换标准定义、交换流程的定义、交换流程的执行等。交换前置子系统支持不同的前置交换库之间的双向信息交换,是前置交换库和交换传输子系统之间的桥梁,需支持多个交换服务的并发运行。接入管理子系统实现对接入点的接入管理与控制,包括接入点注册、配置、维护等功能。交换传输子系统是交换前置子系统之间的信息交换通道,实现交换信息的打包、转换、传递、路由和解包等功能。交换桥接子系统用来实现各转隶单位和该项目相关部门业务库与前置交换库的双向信息同步,由各转隶单位和该项目相关部门应用数据库(或文件等数据)到前置交换库(或文件等数据)之间的信息交换桥接接口,以完成两个数据库(或文件等数据)之间的在线实时交换的系统。运行监控子系统主要实现对信息共享交换子系统的传输、接入节点、数据库运行状态以及适配器等的监控。

2.4 数据管控模型

数据管控主要通过数据管理、资源目录、数据鉴权、数据质量、数据运维、数据血缘和数据分级分类等功能模块,实现对保税区、海关、企业等单位数据的全生命周期管理,如图4所示。

为了消除相同属性信息因定义和描述不一致而导致信息理解和使用出现偏差,数据标准管理提供一整套标准的维护、查询和落地功能以及以最小的劳动成本管理数据标准。元数据编目管理是对信息资源的规范化描述,是按照一定标准,从信息资源中抽取出相应的特征,组成的一个特征元素集合。资源目录管理是按照统一的数据资源目录标准规范,对数据资源进行统一管理,实现数据资源科学、有序、安全使用。数据标签管理提供标签需求分析、标签专题数据预加工(归集、清洗、标准化、整合)、标签数据同步、标签创建和标签计算等功能。

数据质量保证是从数据质量组织机构、数据质量管理以及数据质量验证机制三个方面提供相应的管理流程支持,建立完善的数据质量文档体系,保证整个系统内的数据质量活动都要求有完善的纪录,最终依次建立或完善质量考核体系,由数据处理过程监控、数据稽核、问题管理、日志管理、质量报告、质量问题处理等环节组成。

数据血缘管理是在数据产生、加工融合、流转流通到最终消亡等过程中形成的继承关系集合。通过对接入数据、原始库、资源库、主题库、专题库等各类数据资源间和数据项间的继承关系进行描述和管理,反映数据资源在各个环节间的继承关系。

2.5数据服务功能模块

数据服务功能模块提供面向上层业务应用和面向外部业务系统的服务,主要包括数据资源目录、授权、索引、接口、标签管理和可视化等服务功能。

数据资源目录服务实现用户按权限查看数据资源目录,支持根据目录相关属性和数据项进行数据资源查询。数据授权服务是通过动态授权、鉴权管理等为用户分配各类系统功能权限和数据资源访问权限。数据索引服务是通过统一的索引服务检索接口提供数据资源的位置检索服务,以便快速定位资源所在位置。数据查询类服务是通过标准化的查询功能配置和服务接口调用,以预设或自定义的数据项为单一查询条件或组合查询条件,实现按要素分类查询或基于不确定关键字的一键式全网检索。数据标签服务是提高指标的规范性以及标签管理的规范性,保障数据管理平台用户对标签理解一致以及数据管理平台与外部系统有效互动。数据可视化服务是对数据资产进行统一管控和可视化查看,并能够通过大数据门户建设实现资源资产的展示及统计(已接收数据情况、已共享数据情况)、资源综合检索定位、资源申请审核、调用、查询、下载,资源订阅、缺失资源申请。

2.6数据资源池

按保税区数据使用等级类别要求,构建包含原始库、资源库、主题库、专题库等各类标准统一、组织与挖掘流程规范的系统管理数据资源池,以满足保税区管理内部各单位业务专题数据落地建库需求,为综合展示、数据服务、领导决策提供数据支持。

原始库包含保税区内所有单位内部、外部所有需要组织的数据,对于不同种类的数据,采取了不同的存储机制进行存取。该库保留完整的原始业务信息,解决数据标准化、时效性、一致性问题,不做复杂数据整合,不对外部应用提供查询服务,主要满足资源库、主题库快速批量获取数据需求。

资源库是对原始库数据进行提炼加工后形成的公共数据集合,支撑其他各项业务需求。这些公共数据是经过数据处理系统的清洗、转换、关联、比对等操作后所形成的符合数据质量标准与规范的业务域标准数据。该库由负责数据治理过程功能的治理区和提供外服访问功能的使用区组成。

主题库设计面向常态与非常态业务需求,通过将资源库数据进行二次抽取装载的方法重新组织数据,并按照不同领域专题应用的需求重新整合所形成。通过按照规范对数据进行加工、整理和入库,并构建必要的数据应用的环境,提供统一的数据访问服务,满足应急管理在数据分析、计算与可视化的需求以及常态下监测预警等业务需求以及非常态下开展突发事件应急处置的数据应用需求,支撑系统管理业务应用。

專题库是主题库的数据按照专题应用的需要重新整合形成的数据库。专题库的建库按照专题应用业务模型,通过二次抽取装载的方法重新组织数据,构建满足系统专题业务应用需要的数据库。

3结论

(1)首次在综合保税区业务系统中采用了数据中台实现了数据分析和治理。

(2)基于以共享为基础、以需求为导向的原则,构建了数据中台功能架构模型,实现了保税区数据业务系统的共享治理,推动了保税区业务数据共享开放。

(3)通过构建数据管控和数据服务模型,形成数据资源池,建立了统一的保税区数据治理体系。

参考文献:

[1]朱炜.信息系统在企业组织管理和风险控制中的应用——上海外高桥保税区联合发展有限公司的信息化实践[J].上海企业,2016(6):65-68.

[2]华硕卿. 综合保税区智慧应用平台的研究[D].长沙:湖南大学,2018.

[3]郭银萍. 浅谈综合保税区信息化系统的设计[J].智能建筑电气技术,2020,14(6):110-114.

[4]王振宇,刘晓庆,许伯然. 海关支持综合保税区发展措施常见问题解答[J].中国海关,2020(8):42-43.

[5]刘晓庆,蔡嘉铖.综合保税区业务常见问题解答[J].中国海关, 2020(5):50-51.

[6]苗建琳. 对我国综合保税区发展现状、问题及对策的分析[J].经贸实践,2017(6):129.

[7]张圆圆.郑州新郑综合保税区的发展现状、问题及对策[J].科技经济市场,2015(11):42-43.

【通联编辑:代影】

猜你喜欢

数据模型
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
公路工程试验检测存在的问题及措施
一种借助数据处理构建的智能食堂管理系统
3D打印中的模型分割与打包
浅谈计量自动化系统实现预购电管理应用
FLUKA几何模型到CAD几何模型转换方法初步研究