APP下载

基于通信运营商大数据风险防控的调研报告

2021-03-07廖莎莎

电脑知识与技术 2021年36期
关键词:风控大数据

廖莎莎

摘要:随着通信运营商市场规模的不断扩大,在其内部逐渐建立起针对各类业务相关业务风险稽核管控体系,这种风险体系主要是通过在业务稽核系统中配置相关稽核点,实现对已发生的业务风险进行事后的稽核和整改。为保障支撑企业高质量发展,业务风险管理工作急需数据化转型,通过风险智慧化自动挖掘能力以及构建体系化的数据指标开展预警派单,实现系统自动化的稽核运营。本次社会实践开展了对省内某通信运营商在企业内部大数据风险控制方面的工作调研,并全程参与了项目实施过程,希望能通过调研了解通信行业风险管控的现状及存在的问题,从校企合作的角度为企业在大数据风險控制方面提供相关的意见或建议,同时也为企业思考如何数字化转型提供帮助。

关键词:风险稽核;大数据;风控

中图分类号:TP311      文献标识码:A

文章编号:1009-3044(2021)36-0043-03

开放科学(资源服务)标识码(OSID):

1概述

随着通信运营商市场规模的不断扩大,在其内部逐渐建立起针对各类业务发展相关业务风险稽核管控体系,这种风险体系主要是通过在业务稽核系统中配置相关稽核点,实现对已发生的业务风险进行事后的稽核和整改。我们可以简单理解成初级阶段的数字化,即:将原来线下数据管理迁移到IT系统进行管理。

国资委“十四五”推进数字经济,颁布了《关于加快推进国有企业数字化转型工作的通知》,此文件中要求国有企业要加快数字化转型工作,其中重点涉及基础数字技术平台打造、系统化管理体系构建和数字化转型闭环管理机制建立。“实现作业现场全要素、全过程自动感知、实时分析和自适应优化决策,提升生产质量、效率和资产运营水平,赋能企业提质增效”。“增强基于数字孪生体的设计制造水平,加快形成动态感知、预测预警、自主决策和精准执行能力,全面提升企业研发、设计和生产的智能化水平”[1]。

目前运营商基本实现业务风险管理数据导入系统阶段,或者说是数字化1.0阶段,随着运营商如云、智能组网、物联网、智慧家庭、DICT等各类新兴业务的拓展以及5G移动互联网的快速发展,越来越多的用户、代理渠道、合作商等将享受到因线上业务发展而带来的便捷体验,但是由于各种业务变得越来越错综复杂,在开放式的互联网环境中,运营商将面对来自各个方面的恶劣影响,如蔼羊毛、营销欺诈、恶意订单、系统漏洞等各类风险,从而给企业风险管理工作带来了前所未有的考验。

传统的基于“专家经验”的业务管理模式,在复杂的业务、市场环境中,某些场景下存在不适应性,已经不能完全满足复杂场景的业务风险预防、发现和应对。为保障支撑企业高质量发展,业务风险管理工作急需数据化转型,通过风险智慧化自动挖掘能力以及构建体系化的数据指标开展预警派单,实现系统自动化的稽核运营。

结合在科大国创社会实践锻炼的机会,开展了对省内某通信运营商在企业内部大数据风险控制方面的工作调研,并全程参与了项目实施过程,希望能通过调研了解通信行业风险管控的现状及存在的问题,从校企合作的角度为企业在大数据风险控制方面提供相关的意见或建议,同时也为企业思考如何数字化转型提供帮助。

2调查结果和分析

2.1 基于收入、成本、受理、资金等维度,构建业务风险稽核模块

2.1.1 收入方面

合同项目列收规范性稽核:通过对ICT项目合同的解析,实现对相应收入列账科目的规范性、及时性、真实性的稽核,确保收入真实性。

数据一致性稽核:通过对CRM(客户关系管理系统)系统受理的业务或功能与后端网元侧开通的功能数据一致性的对比,防止因CRM无资料,后端开通导致收入流失,确保前后端数据一致性。

2.1.2 成本方面

代理商佣金稽核:通过系统对CRM受理工单的采集实现代理商佣金的计算、固定稽核点的稽核、发放、清算全流程的线上闭环管控。

2.1.3 受理方面

业务受理合规性稽核:通过接口方式自动采集CRM系统工单,实现CRM业务订单的100%采集;工单采集后,根据配置好的稽核流程及稽核规则自动稽核;对于稽核出来的异常工单,系统固化派单流程,根据受理工号自动对异常工单进行派发;受理人员进行整改后,系统会触发再稽核,整改通过的会自动归档,减轻各环节稽核人员压力。

2.1.4 资金方面

营收资金稽核:通过资金稽核模块实现应缴、实缴、实收稽核,重点围绕营业尾款;退费合规性稽核,稽核范围涵盖全量资金营收资金:现金缴款单、POS票据、支票、银行托收单、电信卡、省拨资金、互抵资金等业务。

业财差异稽核:通过对用户在CRM系统与财务账户上的欠费和预存款差异分析,防止业财差异导致收入流失。

2.2 借助大数据建模针对企业风险管控相关领域数字化转型的初探

本次参与科大国创的项目,对运营商代理商佣金领域利用大数据建模进行了初步的研究,通过逐步建设实践,打造佣金领域的业务风险防护体系。

本次研究主要通过大数据聚类或分类等机器学习算法,建立针对复杂场景的社会渠道套取佣金的风险发现能力。利用Python进行机器学习算法开发,使用Scikit-learn和Tensorflow等机器学习库,通过K-Means、密度聚类(DBSCAN)等无监督机器学习算法,发现异常风险点,对风险数据打上风险标签后,通过决策树和随机森林等有监督算法,对新发展的客户业务数据进行风险预测和预警,提高风险处理时效性[2]。

2.2.1 数据准备阶段

通过大数据平台汇聚CRM系统、计费销账系统、渠道佣金系统、稽核系统等业务系统生产数据,经过数据清洗、整合,建立客户和渠道代理商的数据模型,数据模型主要包括以下数据特征:

客户身份特征:年龄、类型(家庭、个人、商客、政企等)、证件类型等;

客户区域特征:市、县、区域、四级单元、五级包区;

客户产品结构特征:电话数量、手机数量、宽带数量、ITV数量等;

客户使用行为特征:通话时长、流量、短信数量、活跃度、开机信息、客户交往圈、 终端类型、终端串码等 ;

客户价值属性特征:月账单、套餐类型、价值量、在网时长、缴费金额,客户发展渠道和代理商、发展成本(佣金、手续费、渠道积分等);

客户信用历史特征:最小欠费账期、最大欠费账期、欠费金额、停机、拆机历史;

代理商特征:类型、区域、加入时间、历史佣金、当月业务量、当月佣金和激励等。

2.2.2 研究實施阶段

通过无监督机器学习发现异常数据,挖掘潜在风险,由于数据特征比较多,先通过主成分分析(PCA)进行降维,降维后的数据可以通过图形更直观地进行展示,选取最大似然估计自选超参数,即n_components="mle",输出结果发现mle自动降成了两个主成分,且二维主成分累积可解释方差贡献率达到96%,故保留两个主成分,即n_components=2。

但是在聚类算法下,我们实际并不关心某一类具体是什么,最终目的是将这些相似的样本归类放在一起。所以,此聚类算法只要知道如何计算样本之间的相似度,同时将相似的样本进行归类即可,聚类算法通常是不需要通过数据训练学习的,这在机器学习中称之为“无监督学习”。K-means算法就是这种用于统计的无监督聚类技术。

KMEANS算法需要先确定K值,通过误方差曲线图确定K=4为最佳分类,进行聚类后,再对每一类数据特征进行分析,挖掘出佣金和收入拉升比例较低的业务、代理商和客户,存在套取佣金风险。

选择客户收入、客户产生的佣金,佣金/收入比三个特征,进行密度聚类(DBSCAN),进一步挖掘出佣金高、收入低、收入/佣金比低的客户和对应发展代理商。

2.2.3 成果形成阶段

对异常数据进行核查,确认为风险后,对数据打上风险标签类型,如疑似代理商养卡套佣等。对于新增业务发展数据,通过有监督机器学习,自动识别出有风险的数据,进行风险预警,及时进行处置,避免发生套佣损失。

应用成果案例——通过随机森林算法对疑似养卡用户进行预测预警:

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,其输出的类别是由个别树输出类别的众数而定。随机森林算法被广泛使用,对于不平衡的分类资料集来说,它可以平衡误差,即便没有超参数调优,在大多数情况下也能得到很好的结果,并且学习过程快速,是一种灵活且易于使用的机器学习算法[3]。通过随机森林算法对疑似养卡用户进行预测,使用召回率、精确率和ROC曲线对模型结果进行评估:

精确率是指预测的正例中真实的正例所占的比例。

召回率是指真实的正例中预测为正例所占的比例。

AUC指的是ROC曲线下的面积大小,可通过沿着ROC横轴做积分计算得到,该值能够量化地反映基于ROC曲线衡量出的模型性能。AUC取值一般在0.5~1之间,AUC值越大,模型性能越好。

此模型召回率达到83.6%,精确率达到80.3%,AUC值为0.92,模型性能较好。

2.2.4 初步成效

本项目在某运营商进行实施以来,基于佣金领域建立了多个风险控制模型,挖掘了多个风险场景,应用效果良好,通过挖掘潜在风险金对已发放的佣金行清算,或对复杂的风险实现了提前预警拦截,从项目开始至2020年底,给该公司挽回和避免成本损失600多万元。

2.3 存在问题

目前,该运营商已经展开有关业务稽核方面的工作领域有:业务合规性领域、渠道佣金领域、SP/CP合作分成类领域、移动固网终端领域、营收资金等[4],并尝试通过大数据构建系统模型发现和挖掘复杂场景的风险,传统运营商从基于经验的风险挖掘到智慧化风险挖掘已经迈出了一大步,但还有一定的不足,主要体现在三方面:

第一,尚未系统地构建完善的基于大数据体系下的风险控制体系。

第二,尚未构建统一管理的流程、标准框架和规范策略。

第三,大数据风险管控覆盖范围有待进一步提升。目前还是依赖传统经验的风险管控思维,欠缺数字化思维和全流程视角的风险管理思路,特别是针对复杂的风险场景,风险预防能力还急需提升。

3 思考和建议

目前此企业已经在风险管控数字化转型进行了初探,取得了一定的成果,但是还处于数字化转型的初级阶段,最终要实现整体风险管控的数字化转型,有以下三方面的建议:

(1)事前智慧化发掘:业务管理工作由事件驱动型(收集风险信息、风险案例等)向数据驱动型转变。要充分借助大数据技术,通过用户发展质量、代理商佣金、业务质态变化、收入贡献等维度分析和整合,挖掘成本、收入、资金等领域风险,输出业务管理、风险管控等业务规则,提升风险前置识别能力[5]。

(2)事中数据化管理:基于业务规则流程、风险监控预警规则完善优化等,由人工监控向体系化数据指标预警派单转变。对事前智慧化发掘的源头问题,通过事中数据化管理完善业务规则和优化业务流程,提高风险事前、事中前置预警能力,构建电路、云、物联网等新型业务过程监控指标体系,实现对风险体系化数据监控、预警、派单、预防机制。

(3)事后自动化运营:通过已有稽核系统能力优化和整合,减少简单人工稽核的操作,逐步向自动化稽核运营转变。通过基础资源共享,对于事前智慧化发掘的问题开展体系化的扫描,筑牢风险最后一道防火墙,实现风险自动派单,线上接单、核查、整改、反馈,形成闭环管控。

结合此次社会实践,系统地对企业数字化转型的知识进行了学习,并结合本次项目对运营商企业数字化转型进行了思考,提出了一些建议,一个企业如果要真正实现全面数字化转型,需要从内部培养全员数据思维、深入学习数据、善于运用数据,成为用数、赋能、注智的主体,才能真正实现企业数字化转型。

一是培养数据思维。数据思维可以极大提升生产效率,为一线注智赋能做好指引,带来企业的长效增长。企业全员需要具备数据思维,具备挖掘研判内外部数据的能力,才能匹配精准策略。

二是深入学习数据。要学习研究数据怎么入库、数据如何建模、数据应用场景,通过学习数据来培养数据意识,做到人人心中有数,从对用数有感觉到用数据做贡献。

三是善于运用数据。要积极使用新技术、新方法、新工具,通过数据建模验证自己的观点,通过数据应用形成工作正循环,实现“人人皆可用数”。

参考文献:

[1] 牛成钊.大数据时代背景下的网络信息安全与舆情应对分析研究[J].信息通信,2020(4):130-131.

[2] 周志华.机器学习[M].北京:清华大学出版社,2016.

[3] 董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,2(1):1-7.

[4] 郑倩倩.大数据背景下智能网络信息管理系统优化设计[J].信息通信,2020,205(1):180-182.

[5] 宋煜,刘艳超.大数据背景下的计算机网络安全现状及优化策略[J].通讯世界,2019,26(8):78-79.

【通联编辑:光文玲】

猜你喜欢

风控大数据
新监管框架下银行的风控和内审体系
宁波P2P网贷发展问题研究
大数据环境下基于移动客户端的传统媒体转型思路
银行双录的现状和问题
基于大数据背景下的智慧城市建设研究
论小微企业融资的风险控制