APP下载

双向大数据审计模式在扶贫政策落实情况审计中的应用

2019-09-10何旦

商讯·公司金融 2019年27期
关键词:大数据分析

摘要:为了更好地推动扶贫政策的落实,在国家审计或内部过程中可以运用双向大数据审计模式,让数据信息帮助审计人员快速精准定位问题疑点,促进党中央精准扶贫工作落到实处。双向大数据审计模式针对异地审计过程中数据获取、数据过滤、数据分析中的难点,尝试将结果数据分析与业务逻辑再现有机融合,依靠逻辑演绎和归纳统计算法,提升教育扶贫、金融扶贫、健康扶贫、产业扶贫和精准帮扶定位方面的智慧审计成效。

关键词:政策审计:大数据分析:应用建模

一、背景

2015年习近平总书记强调要科学谋划好“十三五”扶贫开发工作,提出了扶贫“贵在精准,重在精准,成败之举在于精准”的理念,将大水漫灌式方法转变为精准滴灌式帮扶。十九大后,精准扶贫成为促进新时期三农发展的关键举措,确保贫困人口到2020年如期脱贫。为了更好地推动江苏省扶贫政策的落实,发挥审计的专业监督职能,各级审计机关和单位内审机构分级分批开展了扶贫政策落实情况跟踪审计。

由于各个扶贫相关部门中信息系统的广泛运用,计算机审计优势凸显。相比传统凭证台账式审计方法,通过运用大数据技术可以全面高效掌握有关部门和单位、各地区实施脱贫致富奔小康工程采取的措施、进展情况和工作成效。依靠数据分析定点关注产业扶贫、教育扶贫、健康扶贫、金融扶贫财政措施落实情况,方便揭露弄虚作假搞数字扶贫问题。

二、现状

扶贫政策落实情况审计与传统的财政资金审计、社保审计、工程审计和经济责任审计相比有着自身特点。总体审计数据具有多、杂、广、紧四大特征。一是对象多。单位多,涉及市级、区县级、乡镇级的各类扶贫开发主管部门,财政部门、教育等相关职能部门,帮扶工作队,乡镇政府,村委会;行业多,涉及金融机构、医疗机构、教育院校、龙头企业、专业合作社和个体户以及财政扶贫项目的建设和实施单位。二是类型杂。精准扶贫标准针对当地政府、企业、个人都有不同的指标,各级各地还针对性出台了相关规定,种类繁杂。与此同时,各个审计对象都有一套自己的信息化系统,开发标准、部署架构、数据交互都不相同。三是地域广。相关乡镇、村落、企业以网状分布在贫困县多地,直线距离往往在20公里以上,审计的交通时间成本高。四是资源紧。审计现场时间短,数据分析的硬件主要考虑便携性为主。和专业大型数据分析中心平台相比,现场处理能力和存储空间都相当有限。

因此传统审计方法对扶贫审计的适用性并不高.很多数据分析模型和审计分析平台都会水土不服,需要寻找一种灵活便捷的审计模式来应对此类小快灵的审计项目和需求。双向大数据审计模式在近三年的扶贫审计中多次使用,查出了一些过去想查却没有能力查的问题,成为有益的尝试。

三、原理

双向大数据审计模式ARI/AOP是大数据审计功能模型栈在数据转换层的重点细化,兼顾现有审计信息化建设成果及数据资源的复用。模式中的双向不是简单的功能模型架构中的自下而上或自上而下,更多地反映在两个实际数据分析应用的切入点和着力点,为移动异地审计的大数据分析量身调配。其核心是尝试将多维数据切片与业务系统模块勘察进行双向结合,从两个不同方面增进审计需求的检验性和实现性。

ARI( Automatic Relation Investigation)的本质是将政策审计需求注入多维度信息关联模型中,自动匹配相关信息并筛选矛盾数据。这类方法是传统审计数据分析的改良升级。相比传统单领域、重完整的审计数据分析建模方式,更加注重维度的拓展和数据切片的轻量化。在政策建模实施前尽可能掌握各类政务信息数据,并打分计算其可靠性系数。可靠性系数=数据重要性。数据独立性。数据重要性为样本数据切片与审计目标的贴合程度,由低到高以1-5评分,数据独立性为数据产生、管理和存储的差异性,由高到低1-5评分,越是详尽的数据切片可靠性系数越高。异地数据和跨部门数据可靠性系数也高于同部门不同条线数据。审计数据分析過程中选择可靠性系数排名前列的数据切片,通过SQL或Python代码来建立关联比对模型。审计人员借助回归分析、关联挖掘、聚类学习等数学统计算法,自动化筛选出各类数据切片中的矛盾点和异常点,精准定位政策落实过程中的造假疑点。

AOP( Audit Oriented Programming)着眼于政务管理信息系统本身,以审计目标视角来检测政策落实情况相关的一个或多个信息系统的开发全周期。当前,各类政策落实业务都是通过网络连接的信息系统进行管理。信息管理系统是业务管理流程和业务执行逻辑的信息化体现,程序代码上的漏洞和后门直接反映出业务管理流程上的风险点。以此为入口,能够直接反映出政策执行过程中的错误和问题。通过反编译重要系统函数库,来获取重要计算、统计、存储函数方法的开发编码,验证系统功能实现的真实性和合规性:通过浏览各个系统功能模块的操作界面和执行操作,来探寻能够便于系统使用者用于数据编辑篡改的功能页面:通过调阅系统运行的后台日志脚本,来固化各类违规违纪操作的执行痕迹。该方法紧盯各类数据报表的生成源头,结合信息系统审计的部分功能,来披露由信息系统伪造出的钩稽关系。

ARI/AOP分别从业务数据和业务系统两个角度切入,目的性明确,审计效率较高。通过现场审计项目中数据分析各个阶段的时间耗费成本对比,ARI/AOP双向大数据审计模式在数据采集、标准化转换、建平台切片、应用迁移、复用变更方面更具有优势,更适合在多变的政策审计现场使用。

四、前提

(一)基础准备

长期谋划做好基础性数据切片处理准备,为后期审计切片接口访问创造条件。审计主体定期完成各类基础性数据的入库,在其基础上完成多维切片的生成。扶贫审计期间明确各个相关职能单位的数据提供责任,从审计小组和审计对象及相关单位双向发力,扫除双向分析的数据源障碍。

(二)专业分工

为了更好地保障数据分析效率,提升双向大数据审计成效,审计小组明确职能分工,在允许的情况下成立数据分析小组。配备具备数据建模分析技能和系统开发需求管理技能的审计人员,全面提升数据应用分析的专业化和精细化水平。

(三)时间分配

需要正确预估和认识数据获取和数据整理的时间消耗。由于双向大数据审计与传统数据分析方式的时间分布差异,在时间节点安排和进度管理方面要尽可能向准备阶段倾斜,在扶贫审计过程中将40%的时间用于数据对接和标准化切片,同时完成相关信息系统的摸排调研。

五、实践

在近两年的实际审计过程中,现场数据分析小组以ARI理念贯穿审计数据分析全过程,将省内各个地级市的建档立卡、工商、社保、税务、房产、项目建设等22个维度数据进行标准化切片,提取核心标准表,并计算出可靠性系数列表。选择前十的数据进行关联性建模,并进行模糊关联和链式关联分析。针对贫困人员权益、实际收入、补助发放、政策宣传、帮扶绩效情况运用python脚本完成数学模型,帮助某区精准定位帮扶对象,提升扶贫项目收益。

定位帮扶对象可以使用离散模型中常用的层次分析模型。层次分析法的基本思路与人对复杂问题的决策思维、判断的过程大体上是一致的。首先,将问题分为3个层次:最上层为目标层,即选择扶贫对象:最下层为方案层,即有哪些具体的帮扶对象;中间层为准则层,将人员相关的信息中关联核心标准的十个项目作为十个准则。接着确定各项准则对于目标的权重及各个帮扶对象对于每一项准则的权重,这是一种定量方法。最后将方案层对准则层的权重和准则层对目标层的权重进行综合,最终确定方案层对目标层的权重,使得问题得以解决。

扶贫效益是不是可以优化就是数学规划模型的典型应用。具体实现需要确定决策变量,将获取效益与决策变量建立函数关系作为目标函数,决策变量受限制的因素作为约束条件,从而形成数学规划模型。求解模型的结果就可以判断在约束条件下有没有达到获取效益最大化。

AOP模式也在多个地市级审计项目进行试点。将扶贫系统、医保系统、学籍管理系统和信贷授权系统等10余个信息管理系统进行解析梳理,掌握系统研发的核心流程,建立与审计方案相关的核心功能映射。在厘清映射拓扑图基础上,以JS-GUI完成代碼反编译定位,发现某县系统中进出变动功能和信息调整功能模块的操作后门,堵住了人为批量违规操作的漏洞,确保帮扶全覆盖。

这些就可以使用统计回归模型来实现。用统计方法对大量数据进行分析,建立回归模型,拟合数据的走势情况。根据模型参数相关系数R,用来检验样本的结果是否能够代表总体真实程度的F值,置信区间等统计量来判断模型是否可信。如果模型可信,使用残差分析法则可以找出其中的异常值。如果模型存在缺点,再分析修正模型,可以找出交互项来重新建立回归模型,直至模型完全可信。

六、展望

ARI/AOP双向大数据审计模式让应用数学建模技术和信息化资源更好地下沉并融人异地审计现场,在两年的异地扶贫审计过程中得到了不断完善,弥补了传统审计数据分析的灵活性和针对性局限,令审计更加智能化和自动化。根据双向大数据审计模式特点,ARI/AOP不仅仅只局限于扶贫等政策落实情况审计,也能够在具备充分信息化条件的经济责任审计和专项资金审计中一展身手。

参考文献:

[1]C.L. Philip Chen, Chun-Yang Zhang, InformationSciences.Data-intensive applications,challenges,techniques, and technologies: A survey on Big Data, 2014(275).

[2]黄静.面向方面程序切片技术及其在测试数据生成中的应用[J].知网.2011.

[3]朱律.“大数据分析”技术在推进审计监督全覆盖中的运用,江苏省审计厅网站.2015.6.25.

[4]中国政府网.国务院关于印发存进大数据发展行动纲要的通知.2015.8.31.

[5]中国经济网.习近平扶贫新论断:扶贫先扶志、扶贫必扶智和精准扶贫.2016.01.3.

[6]姜启源,谢金星,叶俊.数学模型(第五版)[M].北京:高等教育出版社.2018.

作者简介:

何旦,无锡城市职业技术学院,江苏无锡。

猜你喜欢

大数据分析
基于大数据分析的低压台区降损系统研究及应用
大数据分析对提高教学管理质量的作用
基于大数据分析的电力通信设备检修影响业务自动分析平台研究与应用
面向大数据远程开放实验平台构建研究
面向大数据分析的信息管理实践教学体系构建
传媒变局中的人口电视栏目困境与创新