APP下载

基于模糊规则的中小企业信用评级系统研究

2013-03-06王宏力

黑龙江科学 2013年4期
关键词:评级数据挖掘信用

靖 固,王宏力,2

(1.哈尔滨理工大学 计算机科学与技术学院,哈尔滨 150080;

2.中国建设银行股份有限公司大庆分行,哈尔滨 163000)

中小企业是我国国民经济和社会发展的重要力量,促进中小企业发展,是保持国民经济平稳较快发展的重要基础。2009年国务院出台了《国务院关于进一步促进中小企业发展的若干意见》(国发[2009]36号),其中明确要求要加强和改善对中小企业的金融服务,逐步提高中小企业中长期贷款的规模和比重。但由于中小企业自身经济规模小、受宏观经济影响明显、自身抵抗风险能力较弱,而银行是以赢利为目的的商业机构,确实很难实现融资支持[1]。

本文在对中小企业客户风险构成要素数据分析基础上,针对中小企业财务数据不规范、评级模型指标构成多样等情况,利用数据挖掘技术建立信贷风险评估模型[2-3],开发了中小企业信用评级系统,规范银行对中小企业的评级过程,提升银行自身的业务效率,减小银行信贷风险[4]。

1 模糊规则算法原理

1.1 算法选取

模糊规则算法最早来源于Zadeh 1965年提出的模糊集理论,Zadeh后来在1970年把该理论描述为解决不确定性的复杂环境下问题的决策支持方法,通过对诸多事实、因素、指标的重要性(权重)的评估,得出一个综合推理、评价结果。模糊规则算法的一个重要特点就是,这些参考因素或者指标可以是定性的,也可以是定量的,还可以是相关的替代性参考项,这一点是很多数据挖掘算法所不具备的优势。

中小企业信贷风险管理中数据信息量大,造成信贷风险项之间没有明确的数学关系描述。还有,中小企业财务制度不健全使财务数据部分缺失、财务数据造假等问题的存在,导致一些规范化的适合用于中大型企业的评级模型失效。但可根据以往经验、过往账目及各造成信贷风险项数据组合发现中小企业信贷潜在风险,这正是模糊规则算法的优势。

1.2 模糊规则系统设计

模糊规则因其较强的宽容性,且简单、适用,在很多专家系统中都有应用,这类系统的设计过程包括[5]:(1)业务分析,数据处理;(2)系统规划设计;(3)系统结果评估与选择三个基本环节。

而其中第1步和第2步环节则涉及模糊规则集的设计、推理过程设计和系统规划设计等部分,也是整个系统的核心。图1是模糊规则开发过程示意图。

图1 模糊规则推理决策的基本框架Fig.1 Basic frame of inference and decision ofthe fuzzy rules algorithm

1.2.1 数据分析

模糊规则模型具有较高的宽容性,适合于多变量、多条件等复杂情况下的数据处理和分类,特别是在定量、评价指标定性不能统一的情况下对特定对象进行评价分类。在经济、社会价值推动下,对特定的社会进行某方面的价值评价分析,是数据挖掘的应用之一,其数据分析的基本过程是根据通过观察对象的内部、外部实际情况的观察,选择能够对其进行区分的属性和数据,这些数据有些是确定的,有些是模糊的。在多轮的观察中,对这些属性进行优化,形成相对稳定的属性集也就是描述性模型,在规范化处理后即为评价指标。

1.2.2 模糊规则库设计

规则库是在确立评价指标的情况下,通过指标的组合,建立推理规则集合的过程,也就是形成一系列“if…else…”推论语句的过程。其中,任何一条规则可以描述为:

其中:xi是推理条件,对应着评价指标,Ai是与条件xi相对应的取值,而y则表示推理结果对象,B1是该规则模糊推理结果。经过组合而成的规则库,见图2。形成的规则库有这样几个特点:

(1)一个模糊规则库中含有多个模糊推论句;

(2)若没有“任何二个规则有相同的前命题FP1,而有不同的后命题FP2”发生,这种模糊规则库称为一致的;

(3)若每二条相邻规则之后命题FP2一定有重叠区域,则此规则库称为连续的。

图2 规则库模型Fig.2 Model of rule bank

1.2.3 权重计算

权重计算过程是在模糊规则推理过程中,对各属性取值进行累加,得到其总分,计算算法如下:

其中:x1是某项指标,gλ({xi})该项指标得分。

1.2.4 结果评价

模糊规则系统结果评价的过程是根据既定标准和权重对象的属性进行划分的过程,标准确定的过程也就是隶属函数设计的过程。在整个全集合中每一元素对某一模糊集合的所属程度都赋予一个介于0与1之间的数值称之为隶属函数,它是以该产品应用领域中的专家经验以及知识作为判断基础,使得产品运作较有安全性。另外隶属函数的形式会随使用者定义而有所不同,在文献中提出许多不同的形式,但大多数在实际应用中只使用规格化的标准隶属函数。有四种标准隶属函数:Z-Type,Pi-Type(lambda),L-Type(pi)和 S-type,如图3所示。

图3 四种标准隶属函数Fig.3 Membership function of four standards

2 系统分析设计

2.1 系统需求分析

本研究的初始目标就是建立自动化的中小企业自动评级系统,随着研究的深入,对评级模型的确定、用户评级数据的历史价值有了新的认识。鉴于这些认识,系统功能定位为:(1)企业用户基本信息、评级数据的输入与管理;(2)企业用户信用评级指标、模型优化与管理;(3)企业用户信用评级与历史信用管理。系统功能模块结构图如图4所示:

图4 系统功能模块结构图Fig.4 Structure of system functional module

2.2 数据模型设计

系统功能的实现依赖于数据及数据之间的关系,根据各部分功能的数据输入、输出及存储需求,从实体关系的角度进行了系统数据模型设计(见图5),并根据数据库规范化设计理论,根据设计的数据库实体关系图进行了物理表设计,所使用的设计工具为E-R Win 7.0,设计中选择的目标数据库管理系统为SQL Server 2005。

根据关系数据库规范化设计理论及系统开发实现需要,中小企业信用评级系统的实体关系图可以转换为如表1所示的八个基本物理表。

表1 系统数据表说明Tab.1 System data

图5 系统实体关系图Fig.5 The system entity

2.3 用户评级模型设计

根据中小企业信用评级模型设计基本方法及科学性、一致性、系统性、可监管等原则,结合《中国建设银行小企业客户信用评级办法(试行)》(建总发〔2009〕101号),选择其中经营者素质、经济实力、偿债能力、企业成长、与我行关系、社会责任等六个一级指标作为评价中小企业信用评级的主要参数指标,下设21个二级指标,具体见表2。

表2 企业信用评级指标Tab.2 Enterprise credit rating index

2.4 信用评级模糊推理

在系统实现中,模糊推理和权重计算是集成在一起的。由于中小企业信用评级指标间的差异性较大,既有定量性指标,同时也有定性指标。本研究从定性、定量角度对评级指标进行了分类,对于定量指标进行了数据规范化处理,分为1~5五个级别,并赋予相应的权重(weight1-weight5),在进行“if…else…”判断后分别加权,而对于定性指标,则有评级人员根据情况,直接打分。具体推理计算过程伪代码如下:

int weightScore(){//企业信用权重int weight=0;//根据每项评价指标,进行模糊判断加权foreach(index in indexColloction){if(index=1)weight+=weight1;if(index=2)weight+=weight2;if(index=3)weight+=weight3;if(index=4)weight+=weight4;if(index=5)weight+=weight5;}//有杰出社会贡献的信用加分weight+=specialContribution//有恶劣社会影响的信用扣分weight+=special//其他特例//……return weight;}

其中,n 为参数总数(i=1,2,3....,20 ,n=20),Si为该项参数的得分,Wi为该项参数的权重。

系统评分计算公式为:

3 系统实现与测试

3.1 系统环境配置

在系统设计的基础上,本研究进行了编程实现,模糊规则推理算法复杂度与规则规模大小和规则嵌套层次有关,但整体来说对系统性能影响不大,所以在一般的PC硬件平台上都可以实现,表3是系统运行的软硬件环境。

表3 系统运行环境Tab.3 The running environment of system

3.2 系统界面截图

从对评级企业信息保护和系统安全角度出发,本系统运行在银行内部局域网,采用C/S架构。图6、图7分别是评级指标管理、历史评级及评级比较等系统界面截图。

图6 系统评级指标管理Fg.6 System rating index management

图7 企业历史评级比较Fig.7 Comparison of history rating

3.3 试验结果与分析

表4是系统对59个有效的中小企业客户评级案例测试的评级结果,专家通过对系统中的评价指标权重多次调整,模拟后的结果与专家人工评级结果最为接近,平均偏离度为8.42%,能满足银行对中小企业信用评级需求,具体权重值设置见表2。

表4 系统评分结果分析Tab.4 Analysis of system score

4 结论

本文在深入分析中小企业信贷风险构成和数据挖掘技术基础上,提出利用模糊规则推理算法,开发中小企业评级系统,对中小企业进行信用评级,主要结论如下:

(1)模糊规则加权算法,具有较强的适应性,对中小企业信用评级财务数据不规范、评价指标多样性有较好的兼容性。

(2)中小企业信用评级模型的设计是一个持续更新、螺旋式优化的过程。随着每年度信用评级发生的新变化,以及企业的发展变化,该模型中的指标应适时调整。

(3)系统中中小企业评级历史管理、企业信用横向纵向对比等功能,可以为银行提供更为科学的优质企业客户筛选依据。

[1] 郎晓瑛,石云.试析中小企业融资难问题[J].行政与法,2012,(5):31-34.

[2]尹晓丽.数据挖掘技术在银行信贷管理中的应用研究[D].南京:南京航空航天大学,2011.

[3]牟慧杨.数据挖掘在银行CRM客户关系管理系统中的研究及应用[D].上海:华东师范大学,2011.

[4]王林.商业银行中小企业信贷业务风险防范研究[J].新金融,2011,(1):53 -54.

[5] Tzeng Gwo-Hshiung.Fuzzy theory and its application:fuzzy MCDM in past,present,and future[EB/OL].(2010 - 02 - 02)[2012-10-18].http://www.knu.edu.tw/lecture.

猜你喜欢

评级数据挖掘信用
探讨人工智能与数据挖掘发展趋势
为食品安全加把“信用锁”
信用收缩是否结束
基于并行计算的大数据挖掘在电网中的应用
信用中国网
分析师最新给予买入评级的公司
信用消费有多爽?
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
创投概念股评级一览表