APP下载

“大数据”时代人民银行经济预测和金融统计研究

2015-10-26唐宏飞

西部金融 2015年9期
关键词:理论研究大数据

唐宏飞

摘   要:本文以人民银行构建“大数据”需求为出发点,分析构建“大数据”的基本条件和制约因素,并借鉴国外央行成功经验和做法,探索人民银行利用“大数据”构建前瞻性、科学性的经济预测和金融统计框架和模型。

关键词:大数据;经济金融;理论研究

中图分类号:F830.31                   文献标识码:B                      文章编号:1674-0017-2015(9)-0089-05

IBM执行总裁罗睿兰认为,“数据将成为一切行业当中决定胜负的根本因素,最终数据将成为人类至关重要的自然资源。”麦肯锡给“大数据”的定义是:大小超出常规的数据库工具获取、存储、管理和分析能力的数据集;亚马逊的“大数据”定义:任何超过了一台计算机处理能力的数据量;维基百科的“大数据”定义:“无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合”;美国国家科学基金会(NSF)的“大数据”定义:“由科学仪器、传感设备、互联网交易、电子邮件、音视频软件、网络点击流等多种数据源生成的大规模,多元化、复杂、长期的分布式数据集”。“大数据”的显著特点是大量化(Volume)、多样化(Variety)、快速化(Velocity)及由此产生的价值(Value)。“大数据”提供给人们新的观察世界方法,并用数据化思维和先进的处理技术去探索海量数据之间的关系。

一、构建“大数据”是人民银行经济预测和金融统计的现实需要

受“大数据”驱动,依托信息共享、高度集成的数据仓库、先进的数据挖掘分析模型,“大数据”将改变人民银行宏观调控、管理与决策的方式与方法。

(一)构建“大数据”,强化人民银行宏观调控管理的智能化。人民银行“大数据”实施后,人民银行业务将从传统的手工处理向全信息化处理转变,业务基础工作重心将从手工或半手工采集数据转换到灵活运用人民银行“大数据”,依托对结构化和非结构化数据的聚类和清洗,优化人民银行综合管理模块数据自动采集功能,实施宏观预测分析,对社会经济运行情况进行综合分析和评价,实时掌控全国经济金融变化动态,实现人民银行宏观调控的智能化处理。

(二)构建“大数据”,夯实人民银行信息服务与决策支持的坚实基础。随着人民银行各类数据处理、管理和交换进一步集中,经济金融数据共享渠道的进一步畅通,“大数据”的统一性和完整度将出现质的变化,人民银行将成为国家调控、政府及其部门、企事业单位等部门数据的枢纽。充分挖掘和运用人民银行“大数据”,为我国经济金融政策的制定、执行、监测、决策和实施,提供快捷、全面的数据支撑和信息支持。

(三)构建“大数据”,有利于人民银行及时掌控、跟踪金融风险。通过深度挖掘人民银行业务数据,建立和完善人民银行现场和非现场监管模型,实施人民银行调控手段的规范化管理,动态跟踪、管理资金流的异常监测,实现人民银行风险控制、内部业务风险控制、外部业务监督管理的智能化处理。

二、人民银行初步具备建立“大数据”的基本条件

人民银行数据是指人民银行在履职过程中所获取的具有分析、研究、决策等功用和价值的数据,包括调查统计、货币信贷、征信管理、财务会计、国库等结构化数据,以及人民银行经过积累的统计、货币分析资料库、图表、文字资料、影音视频文件等非结构化数据。

(一)建立了较为全面的金融业综合统计监测体系。经过多年探索,人民银行目前已构建了包括货币供应量统计、信贷收支统计、现金收支统计、对外金融统计、金融市场统计、人民银行专项调查统计(企业商品价格指数、景气调查指数)和资金流量统计等金融业综合统计监测体系,为人民银行宏观调控服务,着力提高货币政策针对性、灵活性,支持经济发展方式转变奠定了坚实基础。2014年12月,人民银行征信中心与环境保护部政策法规司、国家税务总局稽查局、国家外汇管理局管理检查司、中国出口信用保险公司等8家单位签署信息采集合作文件,标志着人民银行征信系统在信用信息交换共享方面迈出新步伐,将进一步推动我国社会信用体系建设。

(二)建立了规模较大的人民银行数据库。一是建立了金融信用信息基础数据库。截至2013年末,金融信用信息基础数据库收录近8.4 亿自然人和1919.3 万户企业及其他组织的信息; 个人、企业信息全年查询量分别达3.5 亿次和1.04 亿次;全国累计补充完善小微企业信息近243 万户,累计已有35 万户小微企业获得银行贷款,贷款余额72318.90 亿元;全国共为1.51 亿农户建立了信用档案,对10143万农户进行了信用评定,贷款余额2万亿元。二是建立了国库数据库。国库数据汇集了各级政府财务数据和各级国库管理数据,包括各类结构化与非结构化数据。以“3T”系统[指国库会计数据集中系统(TCBS)、国库信息处理系统(TIPS)、国库管理信息系统(TMIS) 三大系统]为核心的现代化国库信息系统总体框架基本形成。2013年,全国通过TIPS成功处理各类业务20798.5万笔,金额136911.25亿元,通过TCBS办理收入业务38070万笔,金额109574亿元;办理实拨资金支出业务621万笔,金额118694亿元;办理退库业务153万笔。2013年国库系统共办理国库收支41.18 万亿元,2013年11 月,国库管理基础信息模块在全国正式上线,国债管理模块与38 家储蓄国债承销机构正式联通。

(三)金融标准化建设取得显著成效。2010年,人民银行推出《银行业标准体系框架》,发布《中国金融集成电路(IC)卡规范》(2 0 1 0版)等1 4项金融行业标准;发布《金融业机构信息管理规定》,建设金融业机构信息管理系统,构建中国首个金融机构名录库,囊括23万多家金融机构信息。2011年3月,人民银行颁布《关于推进金融IC卡应用工作的意见》,启动我国银行磁条卡向IC卡迁移战略。2012年发布《中国金融集成电路(IC)卡规范》(PBOC3.0),组织建设国家金融IC卡安全检测中心。先后发布《证券、期货、保险、印制、银行业标准体系》;修订发布《人民银行信息安全综合规范(2013 版)》,发布《金融机构代码证管理办法(试行)》。2014年8月,人民银行发布《统计数据与元数据交换(SDMX)》标准,规范了我国金融统计信息的处理、交换和对外发布流程等内容。2014年11月,人民银行发布《金融信用信息基础数据库用户管理规范》和《征信机构信息安全规范》。

(四)人民银行数据具有较高的利用价值。人民银行货币政策委员会通过分析研究存贷款及其变动对货币政策产生的影响,对货币政策进行适时适度调整。财政部等部门从人民银行提取数据并加以利用,也会影响其宏观决策的变化。地方政府通过使用国库部门提供的预算收支数据,加强对预算收支情况、地方财政投入等各种管理工作。

三、制约人民银行“大数据”构建的主要因素

当前,存在一些技术、法规因素制约了人民银行“大数据”的建立、分析和利用。

(一)技术操作层面上,数据采集和挖掘仍较为落后。1、数据采集和挖掘较为落后。与阿里巴巴等电商动态的数据采集系统相比,人民银行数据挖掘和采集方式仍较为落后,数据录入处于原始状态。人民银行现在面临的最大问题是没有利用好系统数据,系统利用率大概不到20%。互联网、电子商务等新兴企业在“大数据”处理经验、产品创新能力、市场灵活度等方面都拥有明显的优势,在这种情况下,人民银行更应激活利用内部的“沉睡数据”。

2、数据整理缺乏标准化设计。人民银行数据交换过程中缺乏标准化数据模型,且存在语义区别和数据源的不一致问题,不少业务处理和管理系统缺乏标准化的统一设计,直接导致“大数据”二次开发难。

3、缺乏对非结构化数据利用。人民银行档案管理制度对会计凭证、会计账簿、报表和其他会计资料的完整和安全作出了具体要求,人民银行数据的利用仍以报表、报告等传统方式为主,对数据的分析仍集中在结构化数据,但对图片和影音视频文件等非结构化数据尚未统一进行数字化处理和规定,缺乏多维度智能分析、展示,缺乏对非结构化数据的处理能力。

(二)法律制度层面上缺乏明确的法规依据。人民银行进行“大数据”挖掘,涉及到法律制度建设、系统开发等多方面原因。

1、个人信息采集的合法性问题。《征信业管理条例》第十三条规定:采集个人信息应当经信息主体本人同意,未经本人同意不得采集。但是,依照法律、行政法规规定公开的信息除外。因此,对信息主体的通话的语音信息、营业网点或ATM机的录像信息等,这些数据信息采集如未得到信息主体允许,进一步分析开发是否合法、侵犯个人隐私尚未定论,影响了人民银银行数据采集的拓展。

2、“大数据”的基础设施和安全管理亟待加强。由于“大数据”是伴随着互联网、云计算、移动互联网以及物联网等新技术发展到一定阶段的产物,金融“大数据”的安全问题日益突出,进一步增加了“大数据”的风险隐患,若处理不当可能遭受重大损失。因此,信息安全体系建设、“大数据”安全技术研发、动态数据安全监控机制等亟待加强。

3、跨部门信息共享机制尚未建立。如共享信息的名称、内容、质量、数量、更新频度、授权使用范围和使用方式、共享期限、共享依据、实现进度等事项,以及信息共享相关标准规范等尚未建立。

四、国外央行“大数据”运用比较分析及借鉴

以下主要介绍“定向算法文本分析”(简称DATA)、XBRL分析框架在国外央行的运用情况,以期对我国“大数据”利用提供借鉴。

(一)欧洲央行(ECB)和美联储运用“定向算法文本分析”(简称DATA)的新方法和统计手段。在2014年11月份的报告中,欧洲央行描述了基于“大数据”的经济预测方法。DATA是基于文本数据集内的特定术语搜索,该搜索是以信念叙述理论为指导。信念叙述理论不仅表面上关注人们对经济的感性预期,如“积极/消极”,“乐观/悲观”等,而且深入分析经济决策背后隐藏的人类情感,包括情感的性质及程度。通过采用DATA方法来直接地、透明地构造情感转移的相关性指标,评估这种相关性是否显著。如将相对情感指标(BROKER)定义为一个月之内兴奋类关键词和焦虑类关键词出现的频率之差,这个差值除以文本中的总字数即是标准化后的指标。密歇根信心指数(MCI)主要用于衡量消费者的购买能力和购买意愿。指数以至少500次电话采访,询问大约50个问题,为期两周的调查数据为基础构成。指数每月发布两次,其中初步数据在每月第二个周五发布,最终结果在每月第四个周五发布。研究表明,初步指数和最终指数间高度相关,因此,关键是预测T+1时点初步指数较T时点最终指数的变化,这个变化值用DIFFPRELIM来表示。

按照“大数据”预测方法,DIFFBROKER对DIFFPRELIM的回归。DIFFPRELIM=初步指数(T+1)-最终指数(T),DIFFBROKER=BROKER(T)-BROKER(T-1),T为2010年7月到2012年3月中的任意某月。将两者数据进行回归分析,可得到2012年5月的密歇根指数预测值,如此逐月推进重复此项运算,直到估计出2013年7月的指数。从2012年5月到2013年7月期间的预测结果看,运用基于“大数据”的DATA,对代表消费者信心减去其焦虑的净水平的时间序列数据进行文本分析,对这15个月的数据进行分析,其中预测准确的有12个月。继续用“大数据”方法来预测更远期的MCI值,结果显示即使预测4个月后的情况,BROKER数据仍然显示出预测功能。就预测的正确性而言,预测期为2期时,15个月中有11较准确;预测期为3期时,15个月中有8个较准确;而预测期为4期时,有7个月较准确。

(二)XBRL分析框架在国外央行运用概况。XBRL是“Extensible Business Reporting Language”的缩写,意为可扩展商业报告语言,主要用于商业和财务信息的定义和交换,让在不同系统间共享数据成为可能,被设计成能够适应最复杂的金融报告形式。

XBRL在日本央行的运用。日本央行从2003年中期起开展XBRL试验。2006年2月,日本的金融服务公司每月使用XBRL向日本央行报送数据。日本央行认为,每月使用XBRL报送资产负债表大大减轻数据验证等工作负担。XBRL简化了报送流程,特别是能够通过提交前的验证功能发现报告中的问题。

2、XBRL在南美央行的运用。巴西央行积极研究XBRL(巴西资产负债表注册项目的一部分)的应用。2008年10月,阿根廷央行担当建立XBRL阿根廷临时地区组织的组织者,并向XBRL国际组织申请直属成员资格。阿根廷央行实施资产负债表注册项目,该项目主要是根据公司规模、市场知名度等标准分阶段实现财务报送的XBRL化,主要目标是对阿根廷各类公司进行清晰的信用评级。

3、XBRL在西班牙央行的运用。西班牙政府发布了JUS/206/2009号法令后,XBRL已成为西班牙年度数字化财务报表编制的基础。每年,2,743个实体向西班牙央行报送109,554份XBRL报告,XBRL技术的引入实现了数据验证的自动化,提高了数据质量。同时,可以通过对内容严格定义来控制风险。西班牙央行的职责之一是收集、处理和保存西班牙非金融性公司的财务信息,增加对西班牙各分支行业的了解;收集本国金融机构信息,履行其监管国内银行业体系;收集统计数据,向欧洲央行(ECB)报送所有公司数据的职责。西班牙央行正在推进XBRL应用扩展计划,在偿付能力信息、财务报表、互保、外币兑换处和评估公司中增加运用这些公式。

(三)快速预判宏观经济形势。英国央行以前通过统计部门发布的房地产销售数据、就业数据等,判断房地产市场和劳动力市场变动趋势,但统计部门的数据一般有数日乃至数周的时滞,不利于对形势的快速判断。目前英国央行现已运用“大数据”对英国房地产市场和劳动力市场趋势作出快速判断,通过对一些网络搜索关键词的监控,如“按揭”“房价”“职位”等,获取最新的经济运行情况,分析预测客户及交易对手行为。加拿大央行利用“大数据”分析并跟踪宏观经济的变化。

五、相关建议

欧洲等国外央行的探索表明,“大数据”在经济预测和金融统计等领域的应用具有良好效果。应积极借鉴国外经验,探索人民银行利用“大数据”进行经济预测和金融统计。

(一)适应“大数据”要求,规划人民银行“大数据”战略的顶层设计。一是建立“大数据”研究机构。在总行层面设置专门研究“大数据”机构,建立数据管理决策机制和内部协调机制,制定“大数据”工作规划,形成管理数据、使用数据和推广数据的有效工作机制。二是明确“大数据”发展重点。规划明确“大数据”产业的发展重点、空间布局和保障措施,推动和改善与“大数据”相关的收集、储存和分析工具及技术,开展“大数据”应用示范,加大对基础研究的“大数据”获取方式、组织与管理、关联与发现、分析与可视化等方面的研究。三是以数据分析技术为核心。加快非结构化数据处理技术、非关系型数据库管理技术、可视化技术等基础技术研发,并推动与云计算、物联网、移动互联网等技术的融合。加强网页搜索技术、知识计算(搜索)技术、知识库技术等核心技术的研发,并与数据处理技术相结合,为提高人民银行金融调控能力提供技术支持。四是构建覆盖从数据访问、数据传输、数据存储、数据隔离到数据销毁各环节的云端数据安全框架。建立“大数据”隐私保护制度和信息安全保障体系,提高安全防范能力,严密维护信息安全(包括滥用、篡改、损坏、窃取、失泄密等)。

(二)结合人民银行履职特点,科学构建人民银行数据库。借鉴“大数据”理论,建立以总行为中心、分支机构为补充的分布式数据库(见图1),人民银行数据库实行总行统一规划建模,分级管理推进,上下协调一致;本级业务数据由中心统一分发,非业务数据逐级上传,借助人民银行内网“云计算”1技术,提升数据流转、计算分析能力;运用“雾计算”2技术,对人民银行敏感数据进行保护,甄别、控制窃取和滥用数据行为,确保人民银行数据安全。数据库系统的基本结构由经济金融数据库,分析、预测模型库和分析、预测体系三部分组成。运用统计学的理论和方法,对经济金融活动进行分类、量化、数据收集和整理及进行描述和分析,反映经济金融活动规律,为经济金融制度的设计和理论研究以及金融调控机制的实施提供客观和科学的依据。

(三)建立数据共享机制,构建人民银行“大数据”平台。建立与银行、保险、证券等监管机构以及国家统计局、电商、数据公司、互联网平台企业等合作机制,构建共享数据库和信息共享机制。同时,将金融宏观调控与移动网络、电子商务、社交网络等融合,提高内外部数据信息的整合能力。构建人民银行宏观审慎管理“大数据”平台,建立适应“大数据”时代要求的信息化基础架构,通过信息技术手段,采集金融经营管理数据,建立标准化、系统性的数据体系,搭建“大数据”平台,为金融业发展和监管提供基础性的网络支持和信息服务。

(四)借鉴欧洲等央行经验,构建人民银行“大数据”分析和预测模型。借鉴欧洲等央行经验,改进和优化统计范围、工具分类、部门分类、信息披露、数据质量控制等方面,进一步完善金融统计体系。尝试建立人民银行决策知识库和预测、分析模型。要运用“大数据”技术对数据进行采集、整理出的一些关键性指标,构建前瞻性的动态随机一般均衡模型(Dynamic Stochastic General Equilibrium,DSGE)的宏观计量模型,对未来一个时期可能发生的经济金融形势进行分析和预测,提升人民银行宏观预测能力和运作效率,为货币政策制定和执行提供决策参考。

(五)探索挖掘数据结构新方式,建立和完善人民银行“大数据”挖掘与应用体系。结合人民银行宏观审慎管理等职责需要,积极探索挖掘和利用数据结构新方式,如可将传统的银行家调查问卷改变为对银行家情绪的搜集,利用DATA预测银行业机构运营情况。围绕深化经济金融改革、金融宏观调控等需求,统筹好历史数据和当前采集数据的关系,充分挖掘历史数据的潜在价值,并运用“大数据”技术手段提升分析现实数据的能力,形成具有人民银行特色的数据挖掘与应用体系,推动人民银行数据利用向智能化迈进。

参考文献

[1]陈天怡.银行业在大数据时代发展的机遇和挑战[J],甘肃科技纵横.2015,(7):27-29。

[2]胡剑波.我国大数据产业竞争优势研究[J],工业技术经济.2015,(6):55-69。

[3]秦珂.大数据法律保护摭谈[J].图书馆学研究,2015,(12):44-56。

[4]张宁熙.大数据在突发公共事件网络舆情信息工作中的应用[J],现代情报.2015,(6):38-42。

[5]杨璐璐.浅谈抽样调查方法在统计工作中的地位[J].商,2015.(20):80-85。

"The era of big data" the people's Bank of economic forecasting and

financial statistics research

Tang Hong fei

(the people's Bank of Chinese Guilin central sub branch, Guangxi Guilin 541004)

Abstract: with the continuous progress of information construction, the people's bank must comply with the "big data" the trend of the times, the construction and mining "data", to enhance the use of "big data" analysis and prediction ability, provide important decision-making reference for the formulation of national economic and financial policy has very important realistic significance. In this paper, to the people's Bank of the construction of "big data" demand as the starting point, analysis on the construction of "big data" of the basic conditions and constraints, and learn from foreign successful experience and practice exploration of the central bank, the people's Bank of the use of "big data" to construct the forward-looking, scientific economic forecast and financial statistics framework and model.

Keywords: large data; economic and financial theory study

责任编辑、校对:张德进

猜你喜欢

理论研究大数据
双钢琴演奏心理调控的理论及其实践研究
从中国特色到中国学派
浅析我国竞技健美操研究现状与趋势
中学生数学学习方式创新研究
生态翻译学研究简述
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索