APP下载

基于数据中台的审计预警体系构建方法研究

2024-02-18问志光刘成波李飞李超刘海飞

中国内部审计 2024年1期
关键词:数字化

问志光 刘成波 李飞 李超 刘海飞

[摘要]本文提出加快实现数智化技术与审计业务深度融合,运用先进的规则引擎技术建立“指标—单一规则—复杂规则”审计预警规则中心,运用集成机器学习、知识图谱等建立审计智能预警模型方法中心,将数据资源、特征工程、机器学习模型与审计预警分析有效集成,实现从“人审”为主向“机审”为主的转变,构建了数字化、智能化、自动化数字审计新生态,对加快实现数智化技术与审计业务融合具有重要意义。

[关键词]数字化   数据中台   审计预警体系

以数字技术为代表的技术革命正快速推动着我

国治理体系重大转型。在此背景下,国网临沂供电公司(以下简称“公司”)围绕核心业务的重点领域、关键环节,采用大数据处理、规则引擎、机器学习、知识图谱等技术,创新大数据环境下的审计工作新模式,建立“指标+规则”审计预警风险研判基础特征中心、“经验导向+数据科学”审计预警模型方法中心,以数字化、智能化、自动化构建数字审计新生态,加快实现数智化技术与审计业务的深度融合,实现持续审计与适时预警,进一步扩大了审计的覆盖面,提升了审计数据分析的规范化水平。

一、构建基于数据中台的审计预警体系的重要意义

(一)为审计数字化转型提供新思路

建立面向数据中台的审计数据全覆盖和重点业务全覆盖的审计预警监督体系,能够为开创审计数字化转型新局面提供思路。通过系统梳理数据中台数据资源和可扩展外围数据,此次研究提出了公司内外部经营环境风险预警思路和方法,明确审计重点关注内容,助力查找异常、疑点和风险,支持公司深入贯彻党和国家强化审计监督各项要求,为企业安全、稳定、健康运转提供保障和支撑。

(二)为审计数字化转型提供新举措

传统审计数据监督滞后,风险无法被及时发现,容易造成损失扩大化,无法有效实现监督全覆盖。运用数字化技术能够为审计数字化转型提供可行、有效的实施方案和关键方法。此次研究将大数据思维、智能化技术与审计监督预警紧密融合,提出面向电网数据中台的数据资源优化方案,建立“指标—单一规则—复杂规则”层级递进的规则构建方案,并进行“经验导向+数据科学”的预警分析模型设计。整体设计可满足审计大数据分析模型灵活性、实用性、可靠性等方面的要求,有助于实现审计预警实时化、智能化和科学化。

(三)为审计数字化转型提供新模式

此次研究聚焦公司核心业务、重点管理领域及关键风险环节,以全生命周期工程项目费用偏离预警和营销电费回收风险为应用场景,建立灵活审计规则,运用多视角分析方法库,发挥智能实时监控作用,为充分利用数据中台资源,科学揭示和有效防范公司经营管理风险,起到良好示范作用。

二、基于数据中台的审计预警体系基本原理

数据中台的建设内容包括数据体系(数据中心)、技术体系(预警规则中心)、服务体系(模型方法中心)和运营体系(预警应用中心)四大体系。此次研究基于数据中心内营销、物资、工程等审计相关的全量跨域数据,结合规则中心不同业务的预警阈值,通过分析中心,分析多模型关联数据并发出预警提醒,构建了“以风险为导向,以指标为衡量依据”的审计预警体系,如图1所示。

(一)数据体系(数据中心)

数据中台是一个软件系统,是微服务的集合,其中DataWorks数据工程是基于MaxCompute计算引擎,从工作室、车间到工具集都齐备的一站式大数据工场,它能助力企业快速完成数据集成、开发、治理、服务、质量、安全等全套数据研发工作。数据中台可以获取的数据来源主要有两部分:一是从公司内部的财务共享服务中心或ERP系统中获取的企业经营数据、财务数据、管理数据等;二是从企业外部的互联网平台、政府统计数据库、第三方数据库等获取的市场信息、行业信息等。目前,数据中台已存储各大信息系统提取的中间表。第三方外围数据有待扩展,需要应用RPA技术、模式识别技术、自然语言处理等智能化技术进行处理。数据中台能够结合一定自动更新、处理化和存储的制度和技术,为智能审计预警指标、规则和分析提供数据基础。

(二)技术体系(预警规则中心)

审计预警体系将预警规则分解为指标特征、决策规则、规则节点、预警流编排、引擎管理等多维度,全部实现基于圖形用户界面的可配置化。审计预警体系具有负责逻辑解耦能力,即只需业务边界的逐层分解,通过指标、规则、节点就可以定义复杂处理逻辑规则,支持即时调整,实现瞬时规则切换。这些规则形成分类对应企业中长期规划、项目建设、营销管理、人力资源、财务管理等风险分类,设计时参考审计人员经验、新出台的相关制度政策、内部控制要求等,可通过灵活的规则引擎管理加以个性化配置。这些规则,一方面可以直接用于审计风险预警;另一方面,也可应用更加复杂、系统、科学的模型,储备风险预警特征标签。

(三)服务体系(模型方法中心)

数据分析方法种类繁多,且用途和功能各不相同,需要分类设置分析模型方法库。审计预警体系结合审计数据分析发展过程,将其分为经验预警、监管评分、自学习三大类模型方法库。其中,经验常规预警对应审计人员的传统常用分析方法,如对比、结构、趋势、分层、Benford检测等。监管综合评分,是建立多种评价对象的预警风险指标体系(可源于规则中心的指标、规则组合),如子公司运营绩效、某类政策执行效果、工程项目执行等,再通过权重赋值方法、得分组合、排序方法等综合评价方法,形成全面的监管评分模型,实现被监管对象的全维画像。自学习预警,主要运用机器学习、数据挖掘等先进的数据分析模型,利用异常值检测、知识图谱、人工神经网络、深度学习等,实现企业相关预警风险指标的预警。此外,应用模型方法中心的重要指标或规则,学习后还可将有价值的规则再丰富至预警规则中心。

(四)运营体系(预警应用中心)

审计预警体系设置的预警应用中心,可以从外部环境、业务分类、重点对象等方面进行大类划分,每一个大类再划分为相关小类。比如,外部环境,可以分为绿色低碳、乡村振兴、社会责任履行等类别;业务分类依据企业中长期规划要求,分为工程项目、营销管理、人力资源、财务管理等类别;重点对象依据动态监管要求,形成重点客户、重大工程、重要政策等类别。这些预警对象是预警规则中心和模型方法中心的具体应用场景,实时监控审计对象现状,并及时展示智能可视化数据结果,以多种形式自动启动预警结果,通知预警信息,便于审计人员进行职业分析判断和进一步的延伸审计,完成内部审计在线审计监督。

三、基于数据中台的审计预警体系主要内容

审计预警体系建设主要内容包括三部分:第一部分研究公司内外经营环境风险分类、关键指标计算,利用知识图谱发现内外经营风险指标的关联关系;第二部分从体系构建的技术角度,研究数据中台资源优化、审计预警规则库和模型方法庫的建立;第三部分从公司重点关注的工程项目审计和营销电费回收为应用场景,验证审计预警体系有效性,内容如图2所示。

(一)公司内外部经营环境风险分类与特征

在正确认识和把握公司内外部经营环境变化趋势及特征基础上,通过内外部数据资源,企业可以建立公司内外部风险预警分类体系、内外部指标关联关系和某类风险重要影响因素,初步建立公司内外部环境风险分类体系。内部经营环境风险,主要基于数据中台资源进行分类;外部经营环境风险,主要基于公开宏观数据和政策文本数据,明确哪些数据可以用于风险建模计算,确定关键指标计算方法。

本研究利用传统评价方法,对多种风险变动进行描述性统计,分析其特征及趋势,进而利用机器学习的特征重要性排序,提炼重要影响因素,利用知识图谱技术建立微观经营数据与宏观指标的关联关系和发展趋势。

(二)面向数据中台的审计预警体系构建步骤与方法

结合数据中台构建的四个体系,此次研究采用以下5个步骤对审计预警体系进行了构建,如图3所示。

1.理现状。梳理企业已拥有的数据、业务特点,使用的技术,部门等企业组织形态现状。

2.立架构。体系中包含“组织架构”“业务架构”“技术架构”“应用架构”。

3.建资产。数据资产建设包含数据汇集、数据仓库建设、数据治理、模型体系建设,其中最重要的就是模型体系建设。所谓模型体系建设,就是面向具体对象构建的全维度数据模型,通过模型体系可以方便地支撑应用。

4.用数据。基于数据中台构建的数据资产,可以通过服务化的方式应用到具体的业务中,发挥其价值。

5.做运营。运营主要包含数据监控审计、数据价值评估等内容,通过数据运营,可以让更多人感知到数据的价值。

(三)面向数据中台的审计预警风险应用实例

从公司工程项目费用偏离预警与营销电费回收风险预警两大场景出发,此次研究继续对构建的审计预警体系进行验证与实验。这两大场景的风险预警各具特点,结合实验结果再对预警体系构建进行修订和完善。

针对公司工程项目审计,此次研究选择了全生命周期的工程项目中费用控制为预警分析对象,利用数据中心和外围数据资源建立此类工程项目全过程链的业财指标和规则集,运用聚类算法确定费用偏离阈值,通过神经网络预警方法预测下一环节的费用偏离程度,及时提示风险程度,以提高工程建设项目的经济效益。

对于公司营销电费回收风险预警,此次研究运用多源微观客户行为数据和宏观行情数据,形成客户行为全业务链的画像特征集,运用机器学习方法提取客户重要风险标签,再利用提取的重要标签实现营销客户之间的关系发现,最终形成高风险营销客户清单,以精准识别风险用户,提高电费管理效率。

四、基于数据中台的审计预警体系实施方案

(一)基于公司内外部经营环境风险分类与特征技术实施方案

公司内外部经营环境风险分类与特征技术实施路线,如图4所示。

通过调研访谈与文献收集,本研究系统梳理了电网经营内外经济风险分类方法和审计实践经验。对于外部环境风险,企业可以电网相关国家层面的经济政策会议文件、公报、通稿为基础,结合电网经济论文、经济研报等,对经济指标、政策等内容进行收集、归类、标签化、分层,拟形成审批环境、规划环境、经济环境、政策环境、法律环境、市场环境、技术环境及舆论环境相关指标,研究这些环境的衡量方法或替代指标。对于内部环境经营风险,企业可以传统审计重点关注的营销、人资、工程、物资、财务、产业等业务为基础,明确哪些微观环境数据可以用于哪些指标体系的建模计算,并与上述外部环境的分类指标集成,形成内外环境风险多层次矩阵。

利用传统评价方法,本研究对多种风险变动进行了描述性统计,分析其特征及趋势。运用知识图谱技术及机器学习等大数据分析技术建立微观数据与审计指标间的关联关系。一是利用机器学习模型对相关指标进行建模,提取重要影响因素;二是通过知识图谱技术,直观地对各类实体和关系进行展示和查询,挖掘风险体系中的指标联系,为各种类型的审计监测预警提供依据。

(二)面向数据中台构建审计预警体系的实施方案

面向数据中台构建审计预警体系的技术实施路线,如图5所示。

数据中台架构能够在数据组织层面,针对多源异构的数据场景,为数据的接入、融合及智能应用服务等提供稳定、高效的支撑。

1.优化预警风险数据资源库(数据中心)。

预警风险信息采集是大数据环境下动态审计预警体系的首要和基础环节。企业通过对外围异构数据和非结构化数据的采集、处理和存储,能够实现对涵盖电子政务(政府采购)、互联网、社交媒体、电子商务等数据的整合性吸收。在此基础上,还可以利用数据挖掘、可视化分析、SQL查询等大数据分析技术对数据库中的相关的风险信息进行进一步挖掘、提取、核对、分析,以此来支撑审计工作准确、可靠的旁证数据资源。此外,针对跨系统不能互通的业财相关数据,提出RPA实时数据采集和处理方案。

2.建立审计预警规则业务库(预警规则中心)。

首先,参考国资委业绩考核体系与电网行业及单位内部管理的相关规定,企业可以梳理传统监督对象(运营绩效、资产管理等)或新兴监督对象等常见的业务与财务指标,并把非货币化、非结构化的行业指标、社会指标纳入监督范畴,形成指标实时计算或提取方案:一是在调用引擎时作为参数传入;二是实现大数据监督的中心接口方式。其次,参考电网行业内部控制流程控制点,从数据元素和业财指标中,构建电网企业规则体系。在技术实现上,对于指标的构建,可以利用规则引擎管理策略,即指标是规则设立的基本元素,通过“指标+条件+动作”形成单一规则的设计,进而形成复杂规则,这些指标与规则加在一起最终形成审计预警特征工程库。

3.构建审计预警模型方法库(模型方法中心)。

本研究将审计预警模型分为三大类。一是经验常规预警模型,主要是传统审计数据分析的基本通用操作。二是监管综合评分模型,结合预警风险分类中的评分对象,不仅是工程项目、子公司运营绩效、人力资源等业务分类,还可以扩展至绿色低碳经营、乡村振兴等企业社会责任、生态类评分对象,集成多种主观与客观权重赋值和得分计算方法,如AHP、功效系数法、熵值、TOPSIS等,审计人员可自定义计算权重,最后直观呈现预警评分结果。三是数据科学支持下的智能化自学习预警模型。主要利用数据科学方法来强化预警的智能化、科学化效果,将其分为传统数据挖掘、新兴深度学习和知识图谱三大类,研究过程主要强调模型参数优化和模型可解释性等方面。

(三)面向数据中台审计预警风险应用实例

此次研究进行了审计预警体系典型场景的验证实验:一是进行工程项目偏离预警分析,场景强调经验阈值的科学设置、费用偏离原因分析和预测;二是营销电费回收风险预警,场景强调客户画像的标签提取和隐藏关系发现,实施步骤分别阐述。

1.电网工程项目全生命周期预警模型及应用——以工程费用偏离预警为例。

(1)了解当前电网工程项目审计实施现状,搜集国内外文献,以电网同类可比工程项目全生命周期的费用控制为预警分析对象,了解此类电网工程建设项目不同阶段工作内容和费用控制风险点、可利用数据表存储情况,同时搜集行业相关标准值。

(2)费用偏离阈值设置。为实现精准费用预警,需要科学设置阈值,采用无监督聚类分析计算阈值范围,避免阈值主观随意性和警情区间不连续问题。

(3)利用机器学习的BP神经网络进行预测性分析。费用偏离受整个生命周期费用活动影响,结合神经网络自学习、自适应的特点,将各项费用活动阶段发生费用偏离度作为神经网络输入元素,将实际总偏差作为输出值,对模型进行训练,获得偏离预测模型。同时,将费用偏离进行子目费用分析,把总偏差最终分解至每一个子目费用,分析建设项目中不同活动对费用偏离的影响程度。

(4)通过分析关键风险点重要影响因素和因素关联性,通过改变影响因素的输入值,完成对下一个施工节点的偏差预警,以警示相关管理方及时采取措施进行处理,达到预警目的。

2.营销电费回收风险预警模型及应用。

(1)基于电网数据中台客户的应收账款、工商登记、信用评级、信用政策、完税证明、电力消耗、银行流水、法律诉讼、合同期限等相关数据,建立这些数据之间的关联关系,运用数据处理技术弥补数据质量问题。

(2)运用规则引擎技术,对其营销电费回收全过程中的业财指标提取、规则生成,通过机器学习的特征计算方法,形成营销电费回收全业务链的风险预警特征集。

(3)运用多种Boost机器学习模型,解释每个风险因素对模型预测值的影响,提取重要风险标签,并对标签进行解释。

(4)将提取标签绘制客户画像,运用关系网络图方法,综合研判预警对象与相关对象之间的隐藏关系和特殊联系,生成营销客户的预警对象清单,便于相关部门提前部署预防。

五、基于数据中台的审计预警体系预期效益

(一)直接效益

一是基于数据中台的审计预警体系可以提供全生命周期的关键技术支撑,涵盖数据资源优化、指标与规则体系设计与管理、前沿实用模型方法库的设计与应用,支持公司重点风险领域的实时预警与监控。基于数据中台的审计预警体系有助于把审计人员从繁重的数据处理中解脱出来,将更多的精力投入规则设计和模型应用,提出更多有价值的审计管理对策。二是基于数据中台审计预警体系可全面增强审计预防与预警、提示与警示、督查与督导相结合的多方面职能,通过审计智能实时预警分析提高企业防范风险能力,更好提升企业经营管理水平。三是企业通过汇聚各类数据资产、消除数据孤岛、将数据进行融合,可以构建统一的数据资产,并在构建过程中进行数据治理,使数据资产符合生产要求,通过数据服务化的能力,快速服务于业务。通过不断地运营优化数据资产的使用和内容,使得企业数据越用越有价值。

(二)间接效益

一是通过基于数据中台的审计预警体系的应用,企业能够充分运用数智化技术开展数据挖掘、异动监测、问题分析、成因追溯,促进审计数字化转型,实现内外经营风险的持续监控,为建设中国特色国网保驾护航。二是通过基于数据中台的审计预警体系的应用,企业能够建立丰富的数据内外部共享和服务渠道,实现数据价值释放和交换。构建数据中台时,企业可以从组织架构层面成立单独的数据资产管理机构来统筹数据资产的管理,包括牵头制定数据资产的管理政策、拟定数据资产运营规则并监督各个部门执行,同时负责整个数据资产平台的运营、组织和协调工作。该阶段主要是企业基于大数据和人工智能相关技术之上,构建一套源源不断把数据变成资产并服务于业务、让数据用起来的机制,形成数据闭环,通过运营优化持续发挥数据业务价值。

(作者单位:国网临沂供电公司,邮政编码:276001,电子邮箱:honghe166@126.com)

主要参考文献

[1]蔡光程,曹丽霞,刘兴,等.知识挖掘技术驱动的电网企业内部审计风险预警体系研究[J].中国内部审计, 2021(5):31-36

[2]马国瀚,杨昕,卓俊宇,等.基于电力数据的企业运营风险预警模型研究[J].供用电, 2021, 38,(4):

16-21

[3]庞圣玉,廖亦韵.电网企业风险、内控、合规融合管理研究[J].中国电力企业管理, 2020(31):84-85

[4]吴勇,方君,王尚纯,等.基于机器学习模型的审计应用:内涵、模式与风险[J].中国注册会计师, 2021(9):34-40+3

[5]徐锌.数据可视化技术在电力公司审计中的应用[J].环渤海经济瞭望, 2021(12):143-145

[6]閻玺,李晓华.“大云智”等新技术条件下的电网企业智能审计研究与实践[J].中国内部审计, 2020(3):15-21

猜你喜欢

数字化
数字化:让梦想成为未来
家纺业亟待数字化赋能
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化电镀生产流程构建
数字化制胜
数字化博物馆初探
倍压Boost PFC变换器的改进及数字化研究
关于“万方数据——数字化期刊群”简介