APP下载

基于数据仓的监报表系统研究

2021-01-06福建林名涛

网络安全和信息化 2020年12期
关键词:数据仓库报表架构

■ 福建 林名涛

编者按:随着国内经济的快速发展,金融业改革不断深入,金融监管日趋严格,手段更加多样化,科技监管、自动监管将成为新趋势。因此,为减轻统计负担和提高报送质量,规划建设统一的监管报表系统已成为金融机构信息化进程中一项重要任务。本文将探讨基于数据仓的监管报表系统,帮助企业进行数据标准化建设。

下面笔者基于数据仓技术进行深入探讨。

系统建设目标

1.存在的问题

财务公司为一家非银行金融机构,大量的业务数据零散的分布在各业务子系统,数据元不足,数据内容与格式不统一,数据质量参差不齐,甚至出现重复相矛盾的数据。数据的不规范、不标准,使得难以对业务数据进行快速有效的分析和利用,无法实现监管报表信息化、自动化,无法满足监管的要求。

2.系统建设目标

采用先进的技术架构以及成熟的工具产品建立统一监管报表系统,要求报表系统能自动对各业务系统数据进行有效汇聚,对数据进行筛选、抽取、清理转换,并根据各业务主题的需求进行归类、整理,形成规范化、标准化的数据子集,以满足监管指标统计的要求。系统覆盖各类监管报送品种(1104 报表、人行大集中报表、金融基础数据统计、利率报备报表以及各种自定义报表),实现监管报表数据自动化、管理信息化,极大地提高报表数据质量和效率,有效减轻统计人员的工作量。

系统规划设计

1.设 计思路

1991 年比尔·恩门(Bill Inmon)出版的“Building the Data Warehouse”(《建立数据仓库》)一书中首次提出数据仓库的概念。数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定出过程。数据仓库技术就是对现有大量存在的数据进行整理、清洗、加工、归类,形成标准化、规范化、高质量的数据,供企业决策分析之用。数据仓库的基本逻辑架构如图1所示。

图1 数据仓的基本逻辑架构

ODS 层:是作为数据库到数据仓库的一种过渡,暂存从业务系统抽取的源数据,这些源数据从结构和数据上与业务系统保持一致,是后续数据仓数据加工的基础。

DW 层:数据存储集合体,按照一定的主题域对ODS 层数据进行清洗、加工、转换、归类而生成的数据集。数据仓库记录的是历史变化数据,是分析和决策的数据来源地。

DM 层:数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据。一个应用可以装配一个自己的数据集市。

图2 数据仓的系统设计架构

数据仓技术如CT 扫描一样,按一定的时间间隔对数据源扫描抽数,形成源数据。利用数据仓库技术建立统一的监管报表系统,数据来源具有原始性、及时性、准确性,数据仓的数据处理方式又保证了数据的灵活性、统一性、规范性,从而为监管报表的数据生成提供强有力的保障。

2.系统架构

(1)逻辑架构

系统设计按照J2EE 规范标准,采用JavaEE 框架以及B/S 架构,用户通过浏览器访问系统,客户端实现零管理。系统分为数据采集层、数据处理层和数据展示层,采用多层体系架构设计,各层相互独立、灵活拓展,又紧密联系、良好协同,实现整体效率的最大化,确保系统安全稳定运行,如图2 所示。

①数据采集层(ODS+DW)

通过批量采集方式,从业务系统(客户信息系统、结算系统、信贷系统、票据系统等)中采集最基础的业务数据,并提供系统外数据的采集服务和管理,并按一定的数据模型、数据规范对数据源进行清洗、加工、转换、归类,形成规范的数据集。

②数据处理层(DM)

按特定的应用目的或监管范围,对数据集的数据进行装配,形成特定目的的数据子集,如1104 报表数据子集、存款基础数据子集、贷款基础数据子集等等。

③数据展示层(BI)

采用报表展现、图形展现等方式集中展示各类监管数据及各类监管指标。功能包含报表管理、报表设计、取数据公式定义、指标分析、报表计算、数据补录、报表的审核、报表上报、报表查询以及报表的权限管理等。

(2)物理架构

数据仓的数据都为离线数据,通常基于维度建模理论来构建数据表,与业务系统有较大的区别,因而数据仓一般采用独立部署模式,建立独立的数据库服务器或者独立的数据库实例,与业务系统网络可达即可。系统为B/S 架构,同时需部署应用服务器和Web 服务器,应用服务器用于后台数据处理以及按报送要求组装数据;Web 服务器主要为业务人员提供操作页面服务,提供图表展示,如图3 所示。

图3 数据仓的物理架构

3.数据治理

系统设计是否成功,报表取数是否正确,数据质量是关键,没有高质量数据就如无米之炊、无根之本,要保证数据质量必须对业务数据开展数据治理。数据治理就是制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。银监会出台的《银行业金融机构数据治理指引》对数据治理也提出了明确要求,数据治理包含数据模型、数据标准、数据质量、数据管理以及数据安全等等。数据质量和数据标准是数据的灵魂,是建立数据仓的基础和关键。

(1)数据质量

数据的质量直接体现数据的价值,直接影响系统报表数据的准确性以及数据分析的结果,并直接影响监管机构对金融市场的研判和管理。质量不高的数据不仅仅是数据本身的问题,关系到系统建设的成败。要保证数据质量必须公司高层高度重视,将数据治理纳入公司治理统一范畴,自上而下,统一协调行动,明确各业务部门的职责,加强对数据源头的管控,确保数据的准确性、真实性、完整性、及时性。IT 部门辅以正确的技术和工具,提高数据的自取率,加强对数据的及时性、完整性以及准确性的限制,通过对关联性的数据进行校验和审核,尽可能减少数据的不一致性。通过对数据进行事前防范、事中校验、事后监控三阶段的管控,进一步提高业务系统的数据质量。

(2)数据标准

财务公司信息系统基本涵盖资金结算、资金预算、信贷业务、票据业务、账务处理、客户信息管理、反洗钱系统、征信系统、银企互联等子系统,各系统之间的信息有重叠及不一致存在,影响了数据质量及数据共享,因此需要建立全司统一标准化数据模型,为数据仓提供高质量的数据元。

中国银监会制定了《银行业金融机构监管数据标准化规范》,明确金融数据的业务属性和技术属性,将相关业务数据结构映射成统一的监管标准化数据格式。参照规范并根据财务公司的业务特点,可将财务公司的业务分为8 个主题域,分别为基本信息、资产、负债、损益、授信/担保、中间业务、支付清算、财务信息,并将主题域中的数据项抽取出来,对数据项进行分类、定义,编制统一的数据项名称及数据项代码,建立规范的数据字典,如图4 所示。

图4 8 个主题域

数据仓以数据字典为基础,构建数据仓的数据集,建立业务数据源与数据仓数据项的映射关系,并在业务数据抽取过程中,对数据进行清洗和转换,剔除错误数据,保证数据仓中数据的正确性和一致性,提升数据质量。

系统实证

2020 年笔者单位上线了基于数据仓的统一监管报表系统,系统集成了100 多张监管报表。系统每日自动从业务系统中抽取T-1 的数据,并经清洗、加工、转换、分类形成了标准、规范的数据元,给各类报表提供了统一的、规范的数据源。上线以来,基本实现了报表数据的自动化、报表留痕、上报审批流、报表格式接口嵌入等功能,达到系统设计的预期效果。

结语

随着金融行业改革的不断深入和金融“强监管”时代的来临,需要报送的报表越来越多,监管报表涉及的内容将更加广泛、更加精细,对业务数据元的质量要求越来越高。数据仓技术只是数据的一种处理方式,要保证监管报表系统的实用性,需进一步推进企业级数据标准化建设,加强业务数据元精细化规划,构建数据治理的长效机制,提升数据质量,数据源才是监管报表系统成功的基石。

猜你喜欢

数据仓库报表架构
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
基于数据仓库的数据倾斜解决方案研究
构建富有活力和效率的社会治理架构
探析电力系统调度中数据仓库技术的应用
数据仓库系统设计与实现
VoLTE时代智能网架构演进研究
镇长看报表
数据复用在存储数据仓库中的运用
月度报表