APP下载

大数据视角下审计全覆盖的实现路径

2017-10-21王开一焦文秀艾俊杰法颖汇

理财·经论版 2017年4期
关键词:子系统公积金数据库

王开一 焦文秀 艾俊杰 法颖汇

审计是与数据打交道,并最终用数据说话的行业,实现审计全覆盖离不开对数据的分析研究。尤其是在大数据背景下,要实现审计全覆盖就必须对大数据进行系统地深入挖掘。如何深度挖掘大数据,我们认为应当从数据设计、系统设计、方法体系设计、应用创新四个方面入手建立审计综合分析系统。数据设计关系到审计全覆盖的“覆盖率”,系统设计关系到审计全覆盖的“覆盖面”,方法体系设计关系到审计全覆盖的“覆盖点”,应用创新关系到审计全覆盖的“覆盖度”。如图1所示:

一、数据设计——实现“覆盖率”的最大化

这里的数据设计是指对支持审计综合分析系统的数据的整体规划,包括审计对象数据、审计分析数据、审计法规数据。

数据设计与“覆盖率”的关系,主要体现在数据归集的全面性、完整性与关联性。全面性,是指数据占有的广度而言,就是指审计部门占有的数据必须是所有单位、所有项目的全部数据。完整性,是指数据占有的深度,就是指审计部门掌握的某单位、某行业的数据必须是全部的而不是部分的。关联性,是指各不相关的数据之间必须找到一个或几个关联点,这是实现数据深度挖掘关联分析的必要条件,也是从数据分析角度实现审计全覆盖的关键点。

(一)全面性——全面占有数据

大数据的“大”是个相对的概念,指的是全面充分占有全部的数据资源。对于审计部门来说,就是要充分占有与审计对象、审计事项相关的全部数据信息。即审计对象数据、审计分析数据、审计法规数据等。

1.建立审计对象数据库。

管理审计对象就是通过建立被审计单位数据库,对被审计单位的有关资料进行全面、系统的收集、整理、分析、储存,以利于审计机关对被审计单位有关情况的变化实行动态管理,确保审计对象资料的真实、准确和完整。管理审计对象的目的,一是能够掌握审计的频度,以合理安排审计项目,在项目安排上为审计全覆盖决策提供数据支撑。二是参与数据挖掘分析全过程,进行单位与单位、单位内部纵向和横向的对比分析。因此,要充分占有审计对象数据,建立完善的审计对象数据库。

2.建立审计关联数据库群。

(1)审计数据包括源数据和派生数据

审计数据是审计过程中用以进行挖掘分析,得出审计结果的数据,包括源数据和派生的审计中间表数据。源数据是审计人员从被审计单位采集来的数据,是进行审计挖掘分析的原始数据。审计中间表是审计分析过程中产生的中间数据,这些数据可以参与其他审计过程的再分析,产生出新的审计结果。

(2)科学建立审计数据库群

要深度挖掘数据资源,就要科学建立审计数据库,合理布局数据资源,我们通过近几年的实践探索认为,不能把全部数据不加区分地放在一个数据库中,这样做造成的后果是数据库异常庞大,不易维护,也不利于数据表的查找。合理的布局方法是分类建立数据库群,这样易于维护、易于查找、易于移植也易于实现与即将建立的“政务云平台”的对接。近年来,我们将采集到的数据按功能和类别不同建立了数据库群,如财政数据库、税务数据库、社保数据库、保障房数据库、医疗数据库、住房公积金数据库、公共自行车系统数据库、法规数据库等,如图2所示:

(3)系统管理数据资源

数据存储的目的是为了运用,因此,要能够做到在最短的时间内调动存储的数据,这就要求对数据进行系统化管理。各个不同的子系统将数据存储和数据综合分析方法固化在一起,组合在一起,形成审计管理系统,数据审计分析师通过审计管理系统管理审计数据,分析审计数据。如图3所示。

(4)“政务云平台”数据源的应用

2015年,《国务院办公厅关于运用大数据加强对市場主体服务和监管的若干意见》(国办发〔2015〕51号)发布后,各地正在建立“政务云平台”,因此,在数据库群的设计上要充分考虑这一因素,即:当条件成熟可以登录 “政务云平台”的时候,能够在不改变审计综合分析系统总体框架的条件下,用“政务云平台”数据替代原有数据。

(5)要注重数据的积累

审计数据库的建立,关键在于平时的积累。要充分利用每一次审计机会,采集尽可能多的数据。

如在一年一次的预算执行审计中,我们要充分占有财政部门掌握的全部数据,这些数据主要存储在财政部门的总预算会计系统中,还有相对独立的财政决算系统等。在采集数据时,不能让被审计单位按照审计人员的审计思路导出相关的电子数据,而是将财政总预算系统的后台数据库全部拿来,存入审计部门的审计数据中心,由数据审计分析师进行关联分析。又如在连续开展的保障性安居工程审计中,审计人员要充分占有住建、房管、公安、工商、民政、税务、社保、财政等部门的相关数据,要到相关单位的信息系统数据库中拿来存入审计部门的数据中心,或者与相关单位联网取数,而不能到相关单位的信息系统上比对我们的审计疑点。

3.建立审计法规、审计定性和审计处理处罚数据库

审计法规、审计定性和审计处理处罚数据库的建立,是实现审计全覆盖的质的要求。将审计法规、审计定性和审计处理处罚数据库纳入到审计综合分析系统,并与系统分析查出的审计疑点进行对接,自动套用相应的审计定性和审计处理处罚依据,将是未来实现智能化审计的一条可行的途径。我们已经在建立的审计综合分析系统中设计了“审计定性和处理处罚应用子系统”,并初步实现了审计查出的审计疑点与审计定性和处理处罚的无缝对接,当系统显示出审计疑点时,系统自动调出与之相适应的一条或几条审计定性和处理处罚依据,审计人员可以选择应用。

(二)完整性——完整存储数据

拿来的数据很多、很大、很杂,如何存储?我们经过近十年来对数据采集管理的做法中得到如下启示,对于结构化的数据进行分类建库管理,对于非结构化的数据进行归类建档管理,对于重要的纸质信息进行电子化处理后纳入结构化数据管理范畴。在数据处理方法上,一是要保持一份原始数据,二是要保持数据的原有结构。

1.保持一份原始数据

存储的目的是为了应用,因此,在保证取得的数据有一份源备份外,需要对数据进行适当的转换和整理,整理成适合审计综合分析所需要的数据格式。我们的做法是将所有数据在确保一份源数据外,均转换为SQL_server数据格式。

如财政总预算会计系统,其数据库为Oracle数据库,当数据采集之后,将其Oracle数据库备份一份进行保存,然后对数据库进行格式转换,转换为SQL_server数据格式,以便与其他数据进行相关关联分析。

2.保持数据的原有结构

这一点非常重要,有些“审计综合分析系统”喜好把采集来的数据按审计部门的要求对数据结构进行转换,转换成审计部门规定的数据结构。须知,每个被审计单位的数据结构是不一样的,如果强行按统一的模式进行转换,必然产生错误的数据。如2012年全国社会保障审计中规定的48张表的结构模式,审计后期发现采集到的数据与实际情况产生了较大的差异,有好多是因为数据转换过程中产生了偏差。因此,在转换数据格式的时候,要保持数据表原有的结构。

在住房公积金数据的转换中,原有的数据格式为Oracle数据库,我们采集之后,将其转换为SQL_server数据格式,其中,可以运用的数据表18张,18张表中的字段不加改动全部保留源数据的结构,这样就最大限度地保持了数据的准确性。如DWXX(单位信息表)中的字段保持源数据结构不加改动:ID、dwdm、dwname、fxhzh、fxkhyh、fxr、zgj、yzbm、txdz、dh、lsr、dwxz、dwlx、qcye、isused、bank、newdwdm、isgg、ishborfj、endjjnygr、e n d j j n y d w、e n d j j n y c z、wdh、khrq、xhrq、wtskhth、wtskno、password、fhname、ishjbz、hjbegdate、hjenddate、username、hjbegny、hjendny、hjyfs、jxbz、wtskbankid、qu、logid、logpass、iswtsk、zhyh、zhzh、cztf、user1、qfrq、fcrq、gb_jgdm、sjh、djh、jglx、yxq、dwfenl、ylyjdwname、yljbrname、yqkbgdate、njxd、dh2、fr、organization_id、bank_ org_id、zhtqzh、zhdwmc、clrq、jcjzr、jbbm。这样,在以后年度采集数据后,不需修改表结构,只需简单地将采集到的数据覆盖以前年度的数据或追加在以前年度的数据之后,既可高效完成数据的存储,又可保持数据的完整性和一致性。

(三)关联性——关联数据库群的设计

在设计数据库和数据表的同时,一定要关注数据库与数据库之间、数据表与数据表之间的关联性。要实现不同行业数据之间的相互关联,需要科学、系统地设计数据库群。我们经过多年的实践认为,一个行之有效的方法就是设计数据库群目录索引。

1.数据库与数据库之间的关联性

数据库与数据库之间的关联设计是总体设计,要在建立数据库群之初,就充分考虑到这一因素,使数据库群内部各个数据库之间保持一定的关联性,即用一条或几条无形的线将所有的数据库串联或并联起来,这条无形的线就是进行审计综合分析、深度挖掘审计线索、实现审计数据全覆盖的关键。

在“政府云平台”模式下,不同单位数据库与数据库之间的关联的获取方法有两种:一是借助“政府云平台”综合分析系統建立起来的关联线索,向“政府云平台”管理部门索取数据字典。二是由数据审计分析师从各个单位数据库中发现其相关的关联性。

2.数据表与数据表之间的关联性

从不同单位采集来的数据,其类型、格式、属性各不相同,一般不能直接用于数据之间的关联分析,这就需要对数据进行科学的归类、整理、建立表间的关联性,即表与表相关联的主代码。如要实现某一地区某一年度“三公”经费审计全覆盖,那么该地区各部门的“单位代码”就是主码,审计时就是将“部门基本情况表”与“部门预算执行数据表”按“单位代码”进行关联,并按“单位代码”进行分组,对“公务接待费”“公务用车费”、“公务出国费”分别求和就得出该地区各单位的“三公”经费情况。

二、系统设计——实现“覆盖面”的最大化

这里的系统设计,是指审计综合分析系统的整体框架设计,包括审计对象管理系统的设计、审计数据分析系统的设计、审计法规应用系统的设计。“覆盖面”的最大化是指数据审计分析师或专业软件公司设计的审计综合分析系统的整体框架要大而全。

(一)系统的设计

1.审计对象系统的设计

审计对象子系统用来管理审计对象相关资料,为编制审计项目计划服务,在进行审计调查和审计分析时发挥重要作用。审计对象子系统至少要包括以下四部分内容:一是审计对象主数据库,主要包括审计单位名称及代码、审计对象基本情况、审计对象财政部门反映的财务情况、本单位记录的财务情况,审计对象纳税情况、非税缴纳情况、专项资金使用情况、公积金缴纳情况、单位人员及工资情况、上次接受审计工作情况等。二是审计对象从数据库,即:除与审计对象相关的主数据库以外能够与审计对象关联的其他数据,用目录索引进行关联。三是与该审计对象相关的审计方法库,包括一般的审计方法经验和计算审计方法经验。四是与审计对象相关的审计法规和审计定性及处理处罚依据库,包括审计对象适用的法律法规和适用的常见审计定性及处理处罚依据。见图4。

2.审计业务系统的设计

审计业务子系统是审计综合分析系统中的主要子系统,审计业务子系统的数量决定了審计全覆盖的覆盖面的大小。如:住房公积金审计子系统实现了住房公积金方面的审计全覆盖,财政审计综合分析子系统实现了部门预算执行审计的全覆盖,医院系统审计综合分析子系统实现了医疗收费的审计全覆盖等。建立的审计综合分析子系统越多,覆盖面就越广越全。

审计业务子系统一般由两部分组成:一是基础数据,包括源数据和审计中间表;二是由审计分析模型组成的审计方法库。

以住房公积金审计综合分析子系统为例,介绍子系统的构建方法。

(1)基础数据库。从住房公积金信息管理系统,取得其后台数据库,其后台数据库为Oracle数据库。采集后,经对数据的筛选和整理,将重要的数据表导入审计综合分析系统,在后台数据库中建立一个名为“ZHFX住房公积金”的独立的数据库(见图1),并将“ZHFX住房公积金”数据库中的数据表表名进行汉化标识,如将“Q_wldw”表标示为“Q_wldw单位信息”,表明此表为单位信息;将“q_grxx”表标示为“q_grxx个人信息”,表明此表为个人信息。

为便于管理数据,数据采集后,要在住房公积金审计综合分析系统中,建立树形结构目录菜单,当点击树形结构目录中的菜单时,能够调出相对应的数据表进行浏览,如:当点击“q_grxx个人信息”菜单时,子系统相应执行“select * from 公积金q_grxx个人信息”语句,从数据库中调出“q_grxx个人信息”表。如图5所示。

(2)审计分析模型库。审计分析模型由众多的审计方法组成,这些审计方法按类别进行归类管理,形成一个方面的审计方法体系。如在图6中,住房公积金审计方法体系由单位归集人数分析、公积金缴纳比例分析、公积金贷款单位人员分析、公积金贷款年度分析、公积金贷款额度分析、公积金贷款期限分析、公积金贷款年龄分析、公积金缴纳合规性分析、公积金贷款合规性分析等等组成。

3.审计法规和审计定性处理处罚依据系统的设计

审计法规和审计定性处理处罚依据子系统为各个审计业务综合分析子系统提供法规查询、审计定性和审计处理处罚支持,应当实现与各审计综合分析子系统的无缝对接,根据审计发现的问题自动套用审计定性法规和处理处罚依据,见图7。

(二)系统设计与审计“全覆盖”的关系

审计综合分析业务系统由若干子系统组成,而子系统又由审计方法类组成,审计方法类又由众多的审计方法项组成,审计时,运用这些审计方法类和审计方法项可以实现某一方面和某一点的审计全覆盖,从理论上讲,所有的审计方法类组合在一起便可以实现所有面和所有点的审计全覆盖。如图8。

三、方法体系设计——实现“覆盖点”的最大化

这里的方法设计是指将某一具体审计思路用SQL语句表达并固化在审计综合分析系统中的方法,“覆盖点”的最大化是数据审计分析师尽可能全地归纳审计人员的审计思路,并将审计思路转换为SQL语句固化在审计综合分析系统中的过程。

(一)审计方法体系的设计

审计业务子系统由若干审计方法类组成,每一审计方法类又分为若干个审计方法项,各审计方法类解决某一方面的问题,各个审计方法项解决某一具体问题,审计方法类之间相对独立又相互关联。因此,要合理布局、科学设计审计业务子系统框架,正确归类审计方法。

以部门预算执行综合分析子系统为例介绍审计方法的模块化管理。

1.明确审计方法体系的结构分为三个层次

一是明确审计方法类。如国库集中支付审计分析类、非税收入审计分析类、财政专户审计分析类。

二是明确各个类中的审计方法项。如在国库集中支付审计分析类中,又分为预算管理、预算支出等项;在预算支出项中,又分为会议费支出、招待费支出、公车费支出、出国费支出、差旅费支出、培训费支出等。

三是明确具体审计方法所要达到的目的。

2.要以树形结构形式管理审计方法类和审计方法项

每个子系统由众多的类、项、目组成,要管理这样多层次的系统,需要用模块化集成的方式,以树形结构菜单进行管理,如图9所示。

在部门预算执行审计综合分析子系统的“国库集中支付分析(类)——预算支出(项)”中,列出了若干个具体的审计方法(目):“2012年各单位预算支出金额”“2013年各单位预算支出金额”“2014年各单位预算支出金额”“近3年单位预算支出总体分析”“近3年单位预算支出趋势分析”等。用这样的树形结构管理审计方法是较为常见的形式。

3.审计方法的实现过程

每一个具体的审计方法,可以实现一个具体的审计目标,完成一个具体的审计思路。需要数据审计分析师将审计人员的审计思路转化为SQL语句,并固化在树形目录中。如 “2012年各单位预算支出金额”这一审计方法的SQL语句为:

select 单位名称,

EN_CODE AS 单位代码,

sum(DEB_MONEY) as 支出金额

from 财政ZW2014_ VOUCHER_DETAIL_PAY支付明细凭证2012年

where(AS_code like 501%

or AS_code like 211%

or AS_code like 103%)

and SUMMARY not like %备用金%

group by 单位名称,EN_ CODE。

当在树形结构中点击“2012年各单位预算支出金额”这一目录菜单时,系统自动运行上述SQL语句,得出审计结果,通过数据导出功能,将审计结果导出为电子表格进行核实。如上图所示。

4.审计方法的归集与管理

审计方法是审计人员在现场审计中,总结出来的行之有效的审计分析方法,是审计经验的积累和总结,因此,要注重提炼,纳入某一种类的审计方法体系中进行管理和运用。

审计方法的归纳有两种:一是从现场审计系统(AO)的审计方法管理中吸取好的方法,移植到本单位的审计综合分析系统,归类存入相应的审计方法经验库中,这个过程需要数据审计分析师进行甄别挑选来完成。二是由审计人员在审计过程中总结出来的行之有效的审计方法,由数据审计分析师甄别挑选,归类存入相应的审计方法经验库中。

(二)实现审计全覆盖的思维方式的转变

运用审计综合分析系统实现审计全覆盖,要改变传统的“完成具体审计项目确定的审计目标”的思维方式,而要把审计全覆盖作为审计的总体目标。这就需要改变审计思维,需要数据审计分析师花费大量的时间积极开展无项目审计综合分析,以发现问题,预测趋势。

改变审计思维之一。“只有总体审计目标,没有具体审计目标”,这是无项目审计方式区别于项目审计的一个重要方面,即在审计组织实施过程中,不是局限于对一个个既定的具体审计目标进行检查,而是通过审计综合分析系统,立足于对会计资料及相关经济活动真实性、合法性、效益性的审计监督,从各行各业风马牛不相及的众多数据的相关关系中检查会计行为的相关经济活动的真实性、合法性、效益性,从而发现问题或预测可能发生的问题,而这些问题在审计之前是没有预设的或不可预见的,即大数据的“不是为什么,而是是什么”的理念。

改变审计思维之二。“占有全部数据,开展相关关系分析。”审计综合分析系统是将审计部门占有的全部数据进行相关关系的关联分析,从而发现问题,预测事物发展规律的智能审计系统。系统通过对数据的自动分析,得出审计结果通知审计人员对发现的疑点进行核实认证,而这种审计结果是基于审计部门掌握了全部审计对象的全部数据之后得出的,即覆盖了全部被审计单位和全部审计事项,因此,所得出的审计结果也是基于全部单位的全部事项。

四、应用创新——实现“覆盖度”的最大化

这里的“覆盖度”,指三个方面:一是广度,即审计方法体系数量的多少;二是深度,即通过审计发现深层次的问题的程度;三是能度,即审计发现问题、核实问题、审计定性与处理处罚的自动化程度与准确程度。这就需要在应用中不断总结经验、不断创新方法。

(一)实现审计“全覆盖”广度的最大化

子系统功能的大小,取决于审计方法的多少,因此,在审计工作中,数据审计分析师要经常向审计综合分析系统中追加新增的审计方法体系、审计方法类和审计方法项,不断扩充内容,使审计的覆盖范围更广。

当我们在审计综合分析系统中建立起了财政审计、税务审计、社保审计、金融审计、部门预算执行审计、民政审计、医院审计等审计方法体系,实现了上述类别的审计全覆盖的条件下,需要在审计工作中,探索新的审计覆盖领域,建立新的审计方法体系,这就需要审计人员和数据审计分析师一起实现更多的审计方法的创新。

例如:当公共自行车系统逐渐走进我们生活的时候,需要开展公共自行车系统的审计,实现公共自行车系统审计的全覆盖,就是在审计工作中探索的新的审计覆盖领域,现介绍如下:

第一,通过审计调查,确定了审计分析事项和所要揭示的问题为:通过财务生存能力分析,揭示经济运行效果;通过资源配置分析,揭示资源配置的合理性和产品质量的稳定性;通过公共自行车调度分析,揭示调度管理的科学性和合理性;通过运行维护分析,揭示运维机制的科学性和效率;通过租车管理分析,揭示租车管理的科学性和合规性;通过制度执行情况分析,揭示“碳积分”制度和“黑名单”制度建立情况和执行效果;通过信息系统控制分析,揭示信息系统的真实性、安全性。

第二,根据审计调查确定的审计事项,设计子系统的框架。将子系统框架设计为相对独立的11个审计方法类,即财务生存能力审计方法类、资源配置审计方法类、车辆调度审计方法类、运行维护审计方法类、内部管理审计方法类、收费管理审计方法类、“碳积分”制度审计方法类、“黑名单”制度审计方法类、手机租车超时收费审计方法类、刷卡租车超时收费审计方法类、信息系统模拟审查方法类。如图10所示。

在审计方法类下,建立审计方法项。如在信息系统模拟审查方法类中,添加客户信息完整性测试、租借时间真实性测试、“碳积分”里程真实性测试、“碳积分”分值真实性测试等方法项。

(二)实现审计“全覆盖”深度的最大化

审计“全覆盖”深度的最大化是指在现有的审计方法体系内追加新的审计方法类和审计方法项,发现以往审计中没有或不曾发现的问题。如:保障性安居工程审计,经过几年的审计,已建立起了较为完善的审计方法体系,覆盖了众多的面和点。几年的审计中,也掌握了多年来享受保障房人群的数据,而对近几年连续享受保障房政策而没有退出的人群进行分析,是因病,是鳏寡孤独,还是有劳动能力而不劳动甘愿贫困,区别情况进行分析,提出精准的审计建议,将此审计思路转换为审计方法追加到保障性安居工程审计体系的“保障房分配环节审计”类中,就是实现审计“全覆盖”深度最大化的方法之一。在审计过程中,数据审计分析师经常总结审计人员新的思路、新的方法,將其固化在各个审计方法体系的审计方法类中,即是实现审计“全覆盖”深度的最大化有效途径。

(三)实现审计“全覆盖”能度的最大化的展望

审计“全覆盖”的能度,一是对驾驭大数据的能力的思考。是立足于大数据的混杂性,运用大数据的“不是随机样本,而是所有数据”,“不是精确性,而是混杂性”,“不是因果关系,而是相关关系”的理念,改变我们的审计理念、审计组织方式和审计技术方法。如当文字、图像、语音、方位、网络成为数据,数据由SQL发展向NSQL的背景下,审计部门是否还立足于标准数据库,要求被审计单位按照审计部门设计的表和字段报送数据并以此开展审计综合分析,这确实是需要进一步探讨的问题。二是在审计综合分析系统中实现审计发现问题与审计定性、审计处理处罚依据自动识别与无缝对接的运用。(作者单位:许昌市审计局)

猜你喜欢

子系统公积金数据库
网络空间供应链中入侵检测及防御子系统的投资机制研究
网络空间供应链中入侵检测及防御子系统的投资机制研究
数据库
团队与知识管理的关系研究
数据库
浅谈中职学校新型模块化机房建设
数据库
数据库
IPv6环境下动态域名系统的设计与实现