APP下载

P2P网贷平台借款人信用风险评估研究

2017-04-18霍江林刘素荣

金融发展研究 2016年12期
关键词:人工神经网络

霍江林 刘素荣

摘 要:借款人信用风险评估缺失是造成P2P网贷问题平台频出的重要原因之一。本文从分析网贷平台借款人的信用风险着手,筛选网贷平台借款人信用风险的影响因素,建立网贷平台借款人信用风险评估指标体系,并构建基于人工神经网络的信用风险评估模型,进而选取部分P2P网贷平台所披露的137组借款人信息进行实证测试,发现测试结果与实际情形基本一致,借款人信用风险评估指标和模型能满足网贷平台对借款人信用风险评估的需要。

关键词:信用风险评估;网络信贷;借款人信用;人工神经网络

中图分类号:F832.5 文献标识码:B 文章编号:1674-2265(2016)12-0043-05

一、引言

P2P網络信贷平台凭借方便快捷、低门槛的优势,自2006年在中国首次出现后,数量呈几何模式快速增长。然而由于风险管控能力不足,导致问题平台不断出现。《中国P2P网贷风险指数快报》显示,2016年3月末中国P2P网贷问题平台1824家,占全国P2P网贷平台5326家的34.25 %。究其原因,在于中国的网贷平台规模普遍较小、发展时间较短,并不具备完善的风险防范与管理能力。网贷平台所面临的最大风险是借款人的信用风险,然而国内众多平台为抢占市场、快速上市,并没有在风控方面做好充分准备。大多数网贷平台缺乏完善的借款人信用风险评估体系,无法对借款人信用等级做出有效评估,导致平台出现运营危机。2015年,中国政府开始对国内网络信贷行业进行整改,风险控制成为网贷平台整改的核心内容。如何准确评估借款人的信用风险,成为提升网贷平台风险管控能力亟须解决的问题。

P2P网贷平台信用风险问题引起了国内外学者的广泛关注。网贷平台信用风险揭示方面,封延会、贾晓燕(2012)认为P2P网贷是影子银行的一种形式,暴露了中国金融风险监管的不完备。马运全(2012)认为,将P2P网贷平台数据接入征信系统可以最大限度地减少借款人信用风险发生的可能性。Klafft(2008)分析美国网贷平台Prosper的数据,发现借款人信用评级越高越容易获得贷款,逾期还款率也越低。信用风险影响因素研究方面,Herzenstein等(2008)认为借款人的债务收入比是影响信用风险的重要因素。Iyer等(2010) 提出了评估借款人信用风险的数据包括标准的银行数据和性别、年龄等非标准数据。Barasinska(2009)认为借款人年龄、性别、种族也是影响信用风险的重要因素。Duarte等(2012)认为外貌特征都会影响借贷行为。王会娟等(2014)基于“人人贷”的数据发现,对借贷行为影响较大的是工作认证、收入认证、视频认证和车产、房产认证等认证指标。温小霓等(2014)以拍拍贷为例,发现借款人信用积分、性别、住宅情况也对借款结果有影响;信用风险评估方法研究方面,张墨(2015)总结了 P2P 网贷个人信用评价的方法——层次分析法、主成分分析法、因子分析法、神经网络模型法等。张巧良(2015)应用层次分析法对网贷平台风险进行了评价。王保乾和王婷(2016)运用基于层次分析的模糊综合评价分析了大数据对网贷信用评估的影响。于晓虹和楼文高(2016)认为层次分析法、主成分分析法、因子分析法等方法均不太适合于P2P网贷个人信用评价与预警建模研究。Angelini等人(2008)开发了两个神经网络系统来进行信用风险评估,通过对意大利某小型企业的实证研究,表明神经网络适用于评估借款人违约风险。朱毅峰(2008)认为神经网络方法的优势在于对样本数据的分布没有要求,并降低了对差企业的误判率。

综上所述,网络信贷的信用风险评估在国内外的研究均取得了一定的进展。但已有研究往往将关注的焦点放在对信贷平台的风险评估,对借款人信用风险的关注度不够,对P2P网贷平台借款人信用风险的分析也大多采用定性分析法、层次分析法等带有一定主观性的方法,难以客观、全面地反映借款人信用的真实情况。基于此,本文从P2P网贷平台借款人信用角度出发,分析网贷平台借款人信用同个人基本信息的关系,筛选影响借款人信用等级评估的指标因素,选择在信用风险评估中可以解决非线性、不确定性变量关系的人工神经网络模型,对网贷平台的借款人信用风险评估进行实证分析。

二、网贷平台借款人信用风险评估指标的选取

P2P网络信贷的特点之一是网贷平台要求借款人提供的个人信息较为简单,一般包括身份信息、基本资产状况、年龄、学历等个人基础情况。通过第三方认证平台对借款人提供的信息进行认证,根据认证后的信息对借款人的信用等级进行评定,并将信息及评级结果公布在网站上,供贷款人参考。

根据国内目前各大网贷平台对借款人的审核要求,一般需要借款人提供身份证、是否购车、基本资产情况、收入情况、婚姻状况、文化程度、住房条件等资料信息,国外一些平台对借款人审核的条件还包括种族、性别、外貌长相、体重等信息。借鉴国内外P2P网贷平台信用评价指标的选取情况,考虑P2P网贷平台借款人的特点及平台业务需求,本文选取借款人年龄、住房、购车、收入、婚姻、文化程度、历史信用记录、性别、上传照片(代替外貌特征)、居住区域等信息指标,作为网贷平台借款人信用风险评估指标。由于所选指标部分是非数值变量,为了能准确地分析这些变量对借款人信用风险的影响,将性别、住房、地区等设为虚拟变量,将部分指标进行虚拟量化,量化结果如表1所示。

(一)年龄

网络信贷借款人的年龄主要集中在20—60岁之间,年龄较小的借款人储蓄能力较低,缺少良好的消费习惯,其违约风险较高;年龄较大的借款人收入水平较低、突发消费较多,其违约风险也相对偏高。因此年龄在34—45岁之间、拥有稳定工作收入的借款人信用较好,违约风险低。

(二)性别

根据国外研究者的观点,性别成为影响网络信贷信用风险的因素之一。数据表明,女性平均违约金额高于男性,因此假设男性在网贷中的违约风险较低、信用风险小,女性则相对较大。

(三)文化程度

国内外研究均表明,学历对网贷借款人的信用风险有重要影响。一般学历越高,借款人的违约可能性越小,信用越好;反之则违约可能性较大,风险较大。

(四)住房条件

一般情况下,拥有固定住房,且没有房贷的借款人拥有更强的偿债能力,违约动机较小;反之正处于购房还房贷、租房期间的借款人偿债压力较大,违约可能性更高。

(五)收入情况

相对于借款人的工作情况,借款人的收入情况更能反映该借款人的偿债能力。收入稳定且收入越高,违约概率越小;反之则违约概率越高。

(六)婚姻状况

国内外研究认为借款人的婚姻状况也是影响网贷行为的重要因素之一。一般情况下,已婚借款人出于对家庭的考虑,责任感更强、违约率更小,其家庭成员的收入亦增加了借款人的偿债能力,而未婚和离婚借款人的违约概率相较偏高。

(七)购车情况

作为借款人资产的一部分,同住房情况类似,有车且无车贷的借款人信用较高,违约风险越小;无车和有车且正在还车贷的借款人违约风险相对较高。

(八)历史信用记录

根据各网贷平台中公布的借款人信息,可查询各借款人的历史借款次數和逾期次数,其中一笔借款会对应多次还贷和逾期,本文所选的逾期次数直接选取逾期所对应的借款笔数。

(九)外貌特征

国外研究者将外貌也列入网贷违约的影响因素之一。本文用借款人上传照片的正式与否代替外貌特征,上传照片正式的借款人相对违约风险较小,未上传照片或不是本人照片的借款人违约风险较高。

(十)居住区域

一般而言,东部沿海地区经济较为发达,借款人偿债能力较强、违约风险较小,中部次之,西部违约风险最高。

三、借款人信用风险评估神经网络的建立

理论上已经证明,一个隐含层的人工神经网络可以实现任意非线性映射,因此本文采用包括输入层、单个隐含层和输出层的三层人工神经网络作为评估模型。其中,输入层节点数为10,分别为网贷平台借款人信用风险评估选取的10个指标:年龄、住房、购车、收入、婚姻、文化程度、历史信用记录、性别、上传照片(代替外貌特征)、居住区域;隐含层节点数通过模型进行迭代计算后选取最佳值;由于目标输出为诚信借款人(值为1)和不诚信借款人(值为2),输出层节点数为1,为模型测试输出值。

网络结构确定后,使用train函数来训练创建人工神经网络。网络中间层的神经元传递函数选取tansig函数,输出层的神经元传递函数采用purelin函数,学习函数选取learngdm,训练函数采用trainlm。

四、网络信贷信用风险评估的实证分析

(一)数据获取

本文从拍拍贷、人人贷、365易贷、你我贷四家不同运作模式P2P网贷平台2015年披露的数据中,选取78个诚信借款人信息和59个不诚信借款人信息,共计137组信息作为本次网络信贷信用风险评估的样本。各平台所公布借款人交易信息的时间由近至远依次取得,其中在拍拍贷中取得32个诚信和20个不诚信借款人信息,在365易贷取得15个诚信和23个不诚信借款人信息,在人人贷取得13个诚信和6个不诚信借款人信息,在你我贷取得17个诚信和13个不诚信借款人信息。由于借款人的违约概率(历史违约金额同借款总额之比)数值太小,且不同借款人之间违约概率差距过于巨大,不便于模型输出结果的比较,因此将137个借款人违约概率重新定义,将不同违约概率划分为从0到1六个不同的信用等级。0表示信用情况最差,信用评级最低;反之信用评级越大。具体划分结果如表2所示。

由表2可知,违约概率越大,则相应信用评级越低、所对应数字越小;违约概率越小,则相应信用评级越高、所对应数字越大。

(二)训练过程及结果

在模型的训练过程中,从137组数据中选取122组数据作为训练数据,并进行拟合,其中含有68个诚信借款人和54个不诚信借款人信息;随机选取15组数据作为验证数据,其中诚信借款人样本为10个,不诚信借款人样本为5个。训练过程如下:

1. 确定网络结构。将年龄、性别、文化程度、住房条件、收入情况、婚姻状况、购车情况、历史信用记录、上传照片、居住区域作为神经网络的输入变量,信用评级作为神经网络的输出变量。其中,训练样本为107个,测试样本为15个。

网络结构输入层为10个神经元,输出层为1个神经元,中间层神经元按照[n+m+a]选择。其中[n]为输入层神经元个数,[m]为输出层神经元的个数,[a∈[1,10]]之间的整数。计算可得,中间层神经元个数可取4到13个。为确定最佳网络结构,对中间神经元的节点数进行多次拟合,最终以拟合平方误差为准则确定中间层神经元个数。通过拟合发现,当中间神经元节点数为10个时,网络经过61次迭代运算,网络拟合误差达到最小0.0895,网络性能达到稳定。

2. 训练与检验。确定网络结构之后,使用train函数来训练创建人工神经网络,将学习速率设为0.01,最大训练次数设为1000,训练目标设为0.03,创建人工神经网络的代码,并运用Matlab 2014软件编程。

3. 训练结果。利用训练好的神经网络模型对训练样本和检验样本进行预测,训练结果如图1和图2所示。

从图1、图2可以看出,神经网络模型所训练的样本实际值和模型输出值基本吻合,线性拟合系数基本一致,图形相似度较高,拟合情况较好。其训练样本的拟合误差(如图3所示)除81号样本训练误差较大外(0.6129),其他样本基本服从正态分布,因此可将81号样本作为特殊个体忽略,不影响样本总体训练结果。这证明了神经网络模型的拟合程度高,模型预测结果可信度较高。

4. 训练结果对比。在122组样本数据训练结束后,输入15组测试数据,对测试样本输出结果进行验证,如表3所示。

5. 训练结果分析。由以上实证结果可以看出,模型根据122个借款人数据进行训练和学习后,除去误差最大的第81号样本,其他121组样本误差均在可接受范围内。其中有59个样本误差集中在0.01左右,误差在0.02—0.05之间的样本有46组,误差在0.05—0.1之间的有28组,误差大于0.1的样本有3组。测试样本中误差最大为0.0956,所有测试误差均小于0.1。总体上,模型测试的输出结果和实际结果基本一致。

五、结论与建议

研究发现,借款人信用风险评估的缺失是造成问题平台频出的重要原因之一。本文选取的借款人年龄、住房、购车、收入、婚姻、文化程度、历史信用记录、性别、上传照片(代替外貌特征)、居住区域等评估指标,能够满足网贷平台对借款人信用风险评估的要求。通过对拍拍贷、人人贷、365易贷等四家网贷平台137個借款人信用数据的训练和学习,构建的基于人工神经网络的网贷平台借款人信用风险评估模型具备了对网贷平台借款人信用风险评估的能力,且评估的准确率较高。

通过对网贷平台借款人信用风险的评估,结合中国网络信贷发展实际,本文提出以下建议:

第一,完善个人征信体系建设。借款人信用信息的不透明,造成国内各网贷平台对于借款人信用风险无法准确评定。网络信贷行业的发展需要对借款人信用进行审核。仅对借款客户自己提供的信息进行评定,信息真实性无法准确识别,增加了借款人信用风险。因此完善个人征信体系建设,对于网络信贷行业的健康发展、降低网络信贷中借款人的信用风险具有重要意义。

第二,建立多样化的风险分散机制。网贷平台可以按照不同信用等级和借款期限,对借款人每月或每期需偿还的金额和利息做出规定,分散违约风险集中发生的可能性、降低借款人发生违约或逾期的风险。如英国Zopa平台就通过强制约束借款人每月必须偿还的金额,分散了借款人违约风险发生的可能性。

第三,加强政府监管。中国网贷平台起步较晚,发展经验不足,平台的管理水平普遍较低,需要政府的支持和监管。政府需要对网贷平台制定详细的监管准则,鼓励和引导网贷平台构建一套完善的风险评估体系。

参考文献:

[1]Klafft, M. 2008. Peer to Peer Lending: Auctioning Mirco Credits over the Internet[R].Proceedings of the 2008 International Conference on Information Systems,Technology and Management(ICISTM 08).

[2]Herzenstein , M. , R. L. Andrews, U. M. Dholakia, and E. Lyandres. 2008. The Democratization of Personal Consumer Loans? Determinants of Success in Online Peer-to-Peer Lending Communities[R].

[3]Iyer, R.,A. I. Khwaja, E. F, P. Luttmer, and K. Shue. 2010. Screening in New Credit Market: Can Individual Lenders Infer Borrower Credit Worthiness in Peer-to-Peer Lending[R].

[4]李鑫.金融监管与中国P2P网贷的发展及异化[J].财经科学,2016,(5).

[5]李渊琦,陈芳.我国P2P 网贷的风险分析及监管对策[J].上海金融,2015,(7).

[6]封延会,贾晓燕.“人人贷”的法律监管分析——兼谈中国的影子银行问题[J].华东经济管理,2012 ,(9).

[7]马运全.P2P网络借贷的发展、风险与行为矫正[J].新金融,2012,(2).

猜你喜欢

人工神经网络
基于人工神经网络的故障诊断专利浅析
人工神经网络发展历史与训练算法概述
基于人工神经网络的优化配置研究
基于人工神经网络的地震电场卫星数据异常识别
ANN、ANFIS和AR模型在日径流时间序列预测中的应用比较
人工神经网络在旅游人数预测中的应用研究
中国房地产上市公司治理状况预测
浅析人工神经网络在汽车轮轴松旷间隙检测中的应用
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
基于人工神经网络的经济预测模型