APP下载

芝麻信用的个人征信评估体系存在的问题分析

2016-10-29刘杰丁晨阳

2016年29期
关键词:大数据

刘杰+丁晨阳

摘 要:**金融服务公司旗下的芝麻信用作为独立的第三方征信机构,为中国的个人征信体系发展带来重大突破,但其数据的来源可能性与准确性、使用的评分方法的准有效性依然存在问题,本文通过对芝麻信用评分体系进行分析,找出其问题并提出解决方法。

关键词:芝麻信用;个人征信;大数据

一、我国个人征信发展现状

个人征信体系的建设主要分为有两种以政府为主导的公共征信模式和以市场为主导的社会征信模式,前者以德国与法国为代表,后者以美国和英国为代表。自上世纪九十年代以来,我国一直实行的是以政府为主导的公共征信模式,虽有各种大中型专业评级机构在探索个人征信体系,但却没有私营独立的个人征信机构。为完善市场经济、健全市场信用体系,央行于2015年1月为8家私营征信机构颁发了个人征信牌照。其中,**金融服务公司旗下的芝麻信用率先推出了中国首个个人信用评分——芝麻信用分,其作为独立的第三方征信机构,基于对海量数据的搜集、整理、分析,通过云计算、机器学习等技术客观呈现个人的信用状况,并在上百个场景中用户、商户提供信用服务。

二、芝麻信用的个人征信评估体系

**集团旗下的芝麻信用借助阿里云技术,对3亿多实名个人、3700多万个企业的数据进行整合,以推出芝麻信用评分、芝麻认证、风险名单库、芝麻信用报告、芝麻评级等一系列产品。

现在,芝麻信用评估方法采用的是美国三大信用管理局都在使用的FICO,FICO评分系统有五类主要影响因素:客户的信用偿还历史、信用账户数、使用信用的年限、正在使用的信用类型、新开立的信用账户。由于FICO是基于美国人信贷消费习惯与信用卡的普遍应用而建立的,为得到更加准确有效评估结果,芝麻信用最终将身份特质、信用历史、履约能力、行为偏好、人脉关系五个维度的信息作为评断基准。参考国际评分标准,将芝麻信用分区间设置为350至950分。评分结果越高代表信用程度越好,违约可能性越小,并将信用评分从低到高划分为五个等级,代表不同的信用状况。350—550分为最低等级,表示信用状况“极差”,550-600分表示信用状况“中等”,600-650分表示信用状况“良好”,650-700分表示信用状况“优秀”,700-950分为最高等级,表示信用状况“极好”。

而芝麻信用的个人信息数据采集主要来自于三方面:一是**集团旗下的淘宝、天猫等电商平台的交易数据;二是由**金融服务公司通过支付宝、余额宝和蚂蚁微贷等采集到的互联网金融数据;三是由企业、法院、政府等外部机构提供的信息数据;四是由用户主动提供的诸如公积金、车辆、学历、职业等信息。

芝麻信用现已通过线上线下合作方式推广芝麻信用评分应用,包括接入租车、租房、酒店住宿、婚恋社交等生活场景并提供针对性服务,为不同评分等级的用户提供相应额度的消费贷款和现金借贷,与新加坡、卢森堡等国合作建立签证服务,为高评分用户简化的合作国签证申请手续,并为传统企业、金融机构甚至政府机构提供个人征信信息服务。

三、存在问题

基于互联网征信建立的芝麻信用的信息收集面较宽,可以覆盖无法在银行留下信贷记录的学生、工人、农民、个体工商户等群体的信息,也可以利用大量的弱变量进行组合以替代缺乏的信贷记录这一强变量进行风控,但依然存在很多问题:

(一)数据采集不够完整,难以反映信息主体的真实信用状况

由于芝麻信用目前的数据主要来源于本行业内数据,缺少金融机构的信贷数据作为支撑,也没有接入央行征信系统,致使芝麻信用分的计算中缺少对个人银行信贷信息的衡量,亦不知个人资产的真实状况与分布。掌握的碎片化、生活化的侧面信息并不能完全替代类似信贷记录这样的金融性核心信息,因此,芝麻信用在信用历史、履约能力两个维度上的数据采集维度上不够完整,其信用评分的准确性遭到质疑。

(二)海量数据难以消化,对数据挖掘分析技术提出挑战

互联网公司虽然掌握了来自各个渠道的海量个人信息数据,但数据越多,“噪音”越多,就越容易失真,尤其将研究处于前沿领域且不够成熟的社交数据用于评估体系,有待商榷的。个人有效征信数据90%产生在信贷领域,90%使用也是在信贷领域,这使信贷记录缺乏的中国个人征信机构难以海量数据中去伪存真,对数据挖掘和分析技术是一个很大的挑战。

(三)数据采集与个人信息安全、隐私保护的矛盾

芝麻信用采集的数据大部分是用户交易数据、浏览记录、好友信息、消费习惯等网络信息,对此,我国《征信管理条例》和《征信机构管理办法》还没有明确其合法性和商业应用的规范。并且,我国目前没有个人隐私保护的相关法律,芝麻信用这种大数据的征信模式在个人隐私保护方面较难把控,若采集的数据因将来立法被限制使用,则存在法律风险。同时,芝麻信用在采集、存储和提供个人信息数据的过程中,容易受到病毒、黑客的攻击,容易出现安全漏洞导致用户信息被窃取或篡改,甚至导致信用系统崩溃。

(四)“刷分”导致信用违约风险加剧

芝麻信用的高分用户多为淘宝、天猫、支付宝、余额宝和蚂蚁花呗等阿里体系的高频用户。通过多用户比对发现,收入较高且稳定的用户,因习惯使用信用卡而非蚂蚁花呗进行消费,且从不将个人收入转入支付宝、余额宝,在“履约能力”这一项目的评分略低于收入较低但习惯使用蚂蚁花呗、支付宝和余额宝的用户。由此可见,互联网消费信贷和现金信贷的低门槛,使得频繁使用阿里系增加资金往来以刷高芝麻信用分成为可能,无收入能力或稳定收入来源的人群也能成为“高分”用户。这将大致消费信贷和个人金融领域违约风险加剧。

四、对策建议

芝麻信用的个人征信评估体系虽有有不足之处,但仍弥补了传统商业银行在个人征信的繁杂碎片化数据收集处理上的缺失,且相较于原专注社交领域腾讯体系,积累有大量的交易额交易量、消费信贷、金融资产、消费习惯与偏好等数据,未来发展尤可期待。因此,芝麻信用应加强与传统金融机构的合作,实现个人数据信息的共享与交流,并注重对个人线下行为数据的合法采集,完善数据维度。还应根据中国人消费、储蓄、信贷、支付等习惯的变化,对针对信用卡消费设计的FICO模式再进行修改,在大数据分析基础上,筛选出影响个人信用的强变量,同时接入央行征信系统的数据,并与中诚信、中智诚和鹏元等取得个人征信牌照的老牌征信机构进行数据交流,或是建立更贴合中国国情的评分方法,以保证评分的准确性与有效性。(作者单位:陕西国际商贸学院)

参考文献:

[1] 姜蕾.大数据征信在互联网金融领域的应用——以芝麻信用为例[J].西部皮革,2016(6):83.

[2] 季伟.国外个人征信机构体系运作模式比较及对我国的启示[J].金融纵横,2014(8):41-44.

[3] 叶文辉.大数据征信机构的运作模式及监管对策——以**集团芝麻信用为例[J].互联网金融,2015(7):60-63.

[4] 张琪,张鑫.我国个人征信体系市场化研究——以芝麻信用分为例[J].现代商贸工业,2015(8)下:173-175.

[5] 谈儒勇,金晨珂.我国个人征信体系建设的模式探讨[J].征信,2010(1):43-46.

[6] 王冠.基于用户互联网行为数据的个人征信评估体系建设分析一以芝麻信用为例[D].北京交通大学硕士学位论文,2015.

[7] 董亮,李博,互联网金融的模式和发展[J].中国金融,2013(10):19-21.

猜你喜欢

大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路