人工智能技术与税收风险管理创新

2020-04-09王爱清朱凯达

会计之友 2020年7期

王爱清朱凯达

【摘要】人工智能技术的出现和应用，为税收风险管理的创新提供了极为便利的技术平台和创新性思路。“人工智能+税收风险管理”在税务稽查筛选中极具优势，文章选择Bagging和SVM两种计算机算法预测逃税模型，构建了预测指标，快速且精确地对实例进行聚类，将出现明显异常的小类识别为异常，判断其存在税收风险。该模型可在税务稽查中筛选重点企业和可疑业务，以减少税收流失风险，提高税务稽查命中率。人工智能与税收风险管理的结合必将是未来提高税收风险管控水平的重要手段之一。

【关键词】人工智能; 税收风险; 风险管理

【中图分类号】 F208;F812.42 【文献标识码】 A 【文章编号】 1004-5937（2020）07-0126-05

一、人工智能技术原理及其对社会的冲击效应

（一）人工智能技术的原理

人工智能技术亦称为AI技术，被誉为21世纪三大尖端技术之一，近30年的发展势如破竹。人工智能的基本含义是“人工+智能”。通过人为创造类似于人脑思维模式的一种计算机算法，来释放人类大脑中一些繁琐简单的思考活动，即为人工智能的目标[ 1 ]。

目前主流的人工智能系统使用人工神经网络来模拟人类大脑中的神经元，这些网络通过调整神经元之间的连接进行学习。创造智能的方式有两种：一种是首先完全了解大脑思考的全部过程，然后将整个过程进行人为的模拟;另一种是仅大脑功能的模拟，即不对全部过程及结构完全模仿，仅对其本身的作用进行模仿。现代科技还不足以解开大脑的秘密，只能通过对其功能的模拟来实现人工创造的智能。人工智能技术善于识别海量数据中隐藏的模式，而依赖经验和知识的人类却不容易发现海量数据中隐藏的模式和信息，这就是人工智能的优势所在。

（二）人工智能技术对社会的冲击效应

异军突起的人工智能技术之所以势不可挡，在很大程度上是因为开放的软件工具（也称为框架），使得构建和训练一个神经网络实现目标应用程序变得容易，即使用各种不同的编程语言，对已知的识别目标可以离线定义和训练一个神经网络。一旦训练完成，神经网络可以很容易地部署到嵌入式平台上，也可以迁移到各种软件程序和硬件平台上，并借助PC或云的能力训练神经网络。

人工智能技术的出现和实际应用，对很多行业产生了颠覆性的影响，人工智能的广泛应用，使得大部分简单的体力以及脑力劳动被智能机器所替代，这对各个行业的就业产生强烈冲击。社会劳动结构本身呈现金字塔形，底层的就业大部分是简单的體力或者脑力劳动，而人工智能的出现完全可以替代金字塔中的绝大部分底层劳动力，对整个社会的就业产生不可预知的巨大冲击。不仅如此，人工智能技术为整个行业的经营模式以及商业模式开辟出一个全新的方向，对产业营销模式和管理模式的颠覆性改变必将开拓出一片新领域，在开发新领域新技术的同时又会产生大量就业需求。另外，一些基本的人工智能能够帮助各行业大大减少运营成本，并精确完整地完成各项预定任务。诸如此类的变化将对所有行业的商业管理模式提出新的要求。

2017年7月8日，国务院颁布了《关于印发新一代人工智能发展规划的通知》，计划到2030年建成世界主要人工智能创新中心。由此，我国将借助人工智能把税收管理和纳税服务工作提升到一个崭新的高度。当然，在这个发展过程中需要我们以新的思想理念和技术思维，不断研究发掘新的信息技术应用，迭代新的纳税服务产品，深化智能化技术手段，创新“人工智能+税收风险管理”方式。

总之，从人工智能技术特征、实施核心和终极目的来看，人工智能技术为目前实施合作型税收风险管理战略提供了最佳契机。

二、人工智能在税收领域的应用分析

（一）人工智能助推税收管理现代化

自2017年人工智能被写进政府工作报告，我国正式进入人工智能元年，各行业领跑者已经着手自身产业与人工智能技术的结合研究，越来越多的企业开始大规模运用人工智能[ 2 ]。运用计算机进行信息处理以及电子化的时代已经过去，目前最有发展价值和巨大变革的就是对数据的分析以及对人工智能的开发。在各行各业都大力发展人工智能管理的大趋势下，税收与人工智能的结合成为必然。国家税收征管部门对各行各业的税收征管技术必定要在社会平均水平以上，否则对一些采用高科技企业的税收征管监督不能精准地判断企业相关涉税业务的真实性，这对我国税收征管提出了挑战。在各个行业都大力发展人工智能的时代，国家税收征管部门必定要跟上潮流，甚至采用强人工智能技术来协助自己更有效率地对市场主体进行监管，也只有跟上科技潮流，才能对税收征管的相关成本进行必要的降低，以及有效监督相关税收风险，减少国家税源流失。

（二）人工智能助推税收征管提高效率

我国自分税制以来税收征管一直存在征收成本大、管理水平低等各种问题，在国地税还未合并之前双方信息沟通不到位，各自为政，税收征管部门沟通效率不高，导致纳税人纳税成本高，程序的繁多以及鞋底成本的存在也是长期高额征管成本和纳税成本的原因。征管成本的降低需要通过先进的科技和尽职尽责的税务局人员共同来完成。人工智能时代，税收征管系统必然要与人工智能技术完美结合，使得一些简单、冗多、易错的繁琐工作交由人工智能机器人来处理，而一些专业性的税收风险评估以及税务稽查选案工作，依靠人工智能技术利用海量数据进行分析筛选，重塑税收风险管理组织体系，形成集成化的税收风险管理系统。

（三）人工智能优化税收征管程序

自2015年国务院总理李克强提出简政放权，深化“放管服”改革以来，我国相关行政审批事项大大减少，进一步优化了政府职能。然而在税收征管方面依旧存在很多问题，比如相关纳税人身份认定、高新技术企业安全生产设备的资格鉴定等还需要纳税人自身进行判定和申报，手续相当复杂。“最多跑一次”改革仍然是“放管服”改革中最明显的短板。因此，税收征管部门应大力加强人工智能技术在税收认定或鉴定中的应用，进一步简化纳税认定程序，运用人工智能技术帮助纳税人进行相关资格认定，真正为纳税人降低税收风险。

三、利用人工智能推进税收风险管理创新

在人工智能时代，税务机关应充分利用大数据、“互联网+”的信息技术，优化集成内外部数据资源，建设大数据管理平台，加快风险管理与大数据平台对接融合的步伐[ 3 ]，结合高效、准确的“机器学习”算法推动税收管理从“业务驱动”转向“数据驱动”。

集中打造涉税信息数据人工智能云平台，按照互联网思维中的平台思维，通过云平台，一方面集中收集和处理涉税数据信息，另一方面将大数据分析挖掘形成的有价值信息放在人工智能云平台，为纳税人当然也为税务部门和相关政府部门的管理决策提供高端服务。这些通过大数据、人工智能云计算所形成的高含金量的涉税数据信息不同于以往的数据库，主要涵盖诸如“纳税人特征库”“税收知识库”“税收案例库”“税收风险特征库”“纳税人需求调查”“行业税收经济特征库”“地区税收经济特征库”“税收经济分析报告”和“税收营商环境指数报告”，也包括各种应用场景的相关知识，所有这些都是基于人工智能云计算的新型基础设施。全社会可以在这样的条件下构建不同的业务应用，形成高端的涉税服务组合。

人工智能系统依托风险管理系统和大数据平台，对以往正常纳税人以及逃税人的相关海量数据进行分析、筛选和标识，形成数据的特征集[ 4 ]，探索用“机器学习”算法预测纳税人的逃税概率，然后将判断结果提交给税务机关。税务机关再根据策略选择分辨逃税概率较高的纳税人进行严厉的税务稽查，从而节省税务风险管理识别的时间和成本，降低税收管理成本。

传统的检查过分依赖于税务干部业务水平、工作经验以及纳税人在众人心目中的固有形象，这大多含有主观判断性，且判断结果具有离散性，即只存在两种可能性：逃税或者没有逃税[ 5 ]。而使用机器学习算法，由于计算机存储性能、计算性能的指数式提高以及机器学习算法的不断优化，使得可以从海量的过往数据中快速地学习到不同类别（本文中指正常纳税人和逃税人）所具有的特征，然后给出一个纳税人逃税的概率，进而税务局可以重点挑选检查对象。每次预测的结果都可以进行保存，在下次定期预测时被利用，避免人工反复对同一个纳税人进行重复的一些检查、核对工序。

（一）税务风险管理模型的设计思路

通过登记数据、申报数据、财务数据、缴纳税额以及是否享有税收优惠等纳税人的相关数据，建立起纳税人和逃税概率之间的一个预测模型。该模型对纳税人有如下假设：（1）具有相似经营条件的纳税人，比如相同地域、相同行业、相同规模、相同投入的纳税人，他们的纳税额度應该比较接近;（2）企业的财务报表数据是通过一定的会计准则对企业生产经营过程中的资金流动进行会计核算的结果，能较为综合地反映企业的生产经营行为;（3）大量样本可以反映具有相似经营条件的纳税人的行为规律，从而可以从过往的海量数据学习到特征，进而对其他纳税人进行逃税概率的预测。

（二）税收风险管理模型的选择

考虑实际情况，模型选择结合使用Bagging和SVM算法。

Bagging采用重复抽取训练数据的方式进行取样，即从训练集中按等概率抽取样本进行模型的训练，模型可以很好地覆盖训练样本空间的所有数据。此外，Bagging对数据的抗干扰能力较强，适合注册登记类型不同、公司规模大小有差异、公司投资金额有差距的不同纳税人，能很好地保证观测值的“独立同分布”性质。

SVM，即支持向量机，它旨在寻找不同类别训练样本的划分超平面，如图1中的三角和五角之间的划分线C（二维空间显示为划分线，多维空间显示为划分平面）。三角和五角分别代表两类不同的训练数据，虽然A、B、C（都是划分平面）都可以将两类数据进行划分，但是显然C更好，因为它对训练样本局部扰动的“容忍”性最好。例如由于训练集的局限性或噪声的原因，三角可能出现在平面B、C之间，五角可能出现在平面C、A之间，这时候，平面A、平面B都将把数据分错，而平面C却不会。换言之，C平面，即超平面，它所产生的分类结果是最优的。

由于目前的数据是人工根据实际情况对很多数据的评价指标进行了筛选的，数据的特征是比较明确的，所以使用SVM。SVM是专门针对二分类问题的，模型相比于神经网络较简单，不需要花费大量的时间训练。

（三）税收风险管理变量的选择

有监督的机器学习可以形式化地表示为已知目标变量y与输入x之间存在一定的未知依赖关系，即存在一个未知的映射F（x，y），通过逼近函数反复地训练调整，使预测的期望风险降到最低，以找到最佳的F（x，y）近似目标函数。根据研究目标，模型选用“是否为逃税人”作为目标变量。分类器在输出结果的上一层会对每个类别有一个打分，然后将本条测试数据分到得分较高的那个类别。所以，虽然目标变量是个离散值，但是其实可以得到一个概率值（将每类的得分进行归一化就可以得到每类的概率）。对于参与变量，原始数据中可供选择的指标很多，但这些指标并非全部有助于税收流失测算，反而可能因为变量之间的相关性、噪声变量等降低模型的有效性。运用传统的聚类方法、因子分析、逐步回归等进行自变量选择是比较繁琐、艰难的工作，而机器学习支持全样本、全变量参与，符合大数据分析的需求，所以本文运用机器学习法中的噪声稳健性算法计算各变量的重要性排序，然后选取缴纳税额、以往违反税法程度、企业整体税负率等作为参与变量。

最后即可通过将所有申报到税务局的企业信息输入模型进行测评，同时根据实际情况不断修正结果和模型，不断优化和改善，最终使误差达到一定标准即可在全国税务系统进行大规模试用，以减少税务局征管成本，大大减少税收流失。

（四）人工智能在税收风险管理实践中的应用

人工智能主要为税收管理提供了技术支撑，人工智能技术可在税收风险管理中应用于稽查异常企业、异常业务及异常行为三个方面。在税收风险管理实践中应用人工智能技术，可以首先筛选出最有可能逃税的企业，然后对此类目标企业的涉税业务进行系统性筛选，即通过Bagging和SVM算法排查目标企业最可疑的涉税业务并进行重点稽查。

1.筛选目标企业

税务系统在稽查系统中筛选重点稽查企业时嵌入包含Bagging和SVM算法的人工智能算法系统，将两类企业（即正常纳税企业和有逃税行为的企业）的大量相关信息，如企业注册的时间、企业注册的经营范围、企业的注册金额与缴纳税款的金额、企业的信用度、企业在银行的相关信用记录以及企业以往违反税法记录等变量作为训练数据的特征集输入到模型的Input端，训练出筛选目标企业的模型，如图2所示。

通过将税务稽查系统想要筛选的企业的以上信息按照提前设定好的方法转化成相应的特征向量输入到模型中，测出样本企业对行业正常水平的偏离度并评价得分，得分越高的样本企业违反税收遵从度的可能性越大，可以设置得分百分制，设置算法系统将得分超过80分的企业输出反馈到税务筛选系统，再将算法筛选系统选出的目标企业得分以及对目标企业的检查结果信息重新反馈到数据对比库中进行标记修正，同时通过检查结果对算法筛选系统进一步完善和不断增加变量以提高筛选精度，从而使误差达到一个可控范围。

2.筛选重点稽查业务

通过上一步方式筛选得到目标企业，再设计一套算法筛选系统（见图3），将行业平均利润率、行业成本产出比率、行业平均交易价格等参与变量依据税务局赋予的权重进行排列，并且通过一个简单的二分筛选将超过设定标准的业务数额输入到算法筛选系统进行对比评估，将低于设定标准的排除在系统之外。太低的业务数额对税收稽查的成本远大于收益，且会对算法系统构成一定的误差影响。

用于算法系统对比学习的数据库可以采用区块链技术建立一个分布式云账本体系和云发票系统，通过建立企业财务的云账本体系，让能够通过秘钥验证的真实信息进入财务节点。由于区块链信息的不可篡改性，给税务部门在稽查时提供了公开透明的财务证据，且通过企业财务节点与其他节点的连接可以实现所有相关数据全部共享，使数据的质和量得到双重保证。

算法筛选系统通过对区块链云账本体系的数据进行机器学习并根据SVM算法得出数额较大且与行业合理浮动阈值相差较大的重点稽查业务，此时再通过税务稽查人员亲自查验是否存在税收风险问题，并将结果数据重新存入算法筛选系统作为执行下次任务的一个参考指标。

（五）税收风险管理系统的维护

模型建立后，需要控制系统中数据的量和质。在工业时代，最有价值的是自然资源，而在信息时代以及智能时代，最有价值的是数据。对于数据的量，目前来说是不少的，只是由于技术及成本的原因无法开发，无法将隐藏的“数据矿藏”全部发掘出来，因此不仅税务部门需要发掘未开发的数据矿藏，而且其他政府部门也要尽力发掘，不断补充样本，使样本的数量足够大。当样本达到无限大时，就相当于包含所有数据，测量的精度就可近似为真实值。

在数据质的管控方面，要在数据输入端加以把控，保证数据的准确性和完整性，一旦数据准确性发生偏差，最后模型测量结果必然也出现一定的偏差，甚至产生蝴蝶效应，所以通过加强数据准入层面的监管，在数据样本选择环节二次进行筛选将失真数据加以排除，以保证样本精度在可控范围内。

信息共享方面，信息共享的目的，其一是为了扩大数据數量，其二是为了对比本部门拥有的数据是否准确以及是否完整，最终目的是为了保证数据的质和量，因此需要加强税务局和银行、工商、国外涉税相关机构的信息交换工作，打造完整的数据链条以及数据体系，系统地整合数据质量，为后续模型的预测打好基础。

系统安全方面，由于信息技术日新月异，层出不穷的系统漏洞及补丁对税收部门建立的智能预测系统是一种极大的风险，税收管理部门应当定期检查并更新系统，保证防火墙的安全性，防止恶意病毒及黑客篡改程序、窃取数据等。

综上所述，我国税收风险管理体系的改革是大势所趋。税收风险管理与人工智能的结合为我国税收风险管理的创新提供了一条新的思路，在提高纳税人服务满意度以及降低纳税人纳税成本方面，人工智能也提供了新的方向和思路。全面推进智能化税收风险管理，需要在互联网平台、大数据平台和云平台的基础上构建税收风险管理人工智能平台;推进多元异构数据融合，构建复杂应用场景下的多维涉税信息综合大数据应用平台;打造智能化涉税服务系统，搭建税务人工智能基础设施和纳税服务创新平台。可以推测，新的人工智能系统应当是镶嵌于综合纳税服务平台中的一组人工智能软件系统，而不是一台智能机器人。该系统能够自动搜集和处理涉税大数据，依靠强大的机器学习增强学习能力和服务经验，为纳税人提供智能化服务产品，最终形成“流程化+智能化”的税收风险管理模式。

【参考文献】

[1] 李为人，李斌.在税收风险分析中引入人工智能技术的思考[J].税务研究，2018（6）：29-34.

[2] 杜莉，郑毓文.应用区块链技术推动我国增值税征管创新：机制分析和方案设计[J].税务研究，2018（6）：72-79.

[3] 刘小瑜，温有栋，江炳官.“互联网+”背景下高新技术企业的税收风险预警：基于智能优化算法的研究[J].税务研究，2018（6）：80-86.

[4] 王会波.大型企业集团税务风险管控模式探讨[J].会计之友，2017（11）：89-93.

[5] 赵瑜，孙存一，王坤.基于微观数据的房地产业税收流失研究：基于以机器学习法的实证分析[J].中国物价，2015（9）：65-67.