APP下载

金融风暴眼里的大数据

2019-01-14薛玉敏

中国经贸 2019年21期
关键词:爬虫用户

薛玉敏

信息爆炸时代,热点总是瞬息而变。

这不前段时间热火朝天的大数据违规爬虫的事件还没有定论,忽然全部的目光都转向了区块链,但因套路贷引起的行业调整阵痛仍在继续。

近年来国内互联网发展迅速,但是各类APP违法违规收集个人信息的举报不绝于耳,中央网信办到9月份就收到到了8000条举报信息,1/3都是实名举报。

面对愈演愈烈的行业风气,监管层掀起了一场监管风暴。9月6日,杭州的魔蝎数据科技有限公司监管部门查处。数日后,公信宝的运营公司杭州存信数据科技有限公司被公安机关查封,聚信立的运营公司上海诚数信息科技有限公司下发暂停爬虫业务的通知。

9月12日,集奥聚合深圳分公司有10多人被带走。而且集奥聚合北京办公室也被深圳警方带走多人,包括爬虫数据接入负责人和合同负责人。

10月9日,又曝出立木征信于7月18日被查,法人刘勤枫及大部分员工被警方带走。

10月21日,杭州警方对51信用卡委托外包催收公司涉嫌寻衅滋事等犯罪开展调查,更是将这场风暴的热度从行业传向普通大众。

此后北京金融局窗口指导所有大数据企业是否存在违规爬虫业务,央行则是发文调查旗下银行与白骑士等几家第三方数据公司合作情况。

随着整肃的深入,部分中小银行暂停了大数据风控合作业务,甚至传出《个人金融信息保护试行办法》正在征集各方意见,一时间全行业陷入人心惶惶、草木皆兵的境地。

技术本无罪 滥用无底线需要严管

爬虫又称网页蜘蛛、是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,是种自动获取网页内容的程序。业内稍具规模的公司为了业务发展,比如更加精确的用户定位和风险控制,都会做爬虫。通过爬虫将目标用户在互联网上的分散数据收集起来,再作为参数输入到模型代码中,从而实现更为精准的风控。

但问题是国内互联网环境缺少隐私保护、数据安全存在漏洞。国内一些大数据公司依靠爬虫技术窃取客户上网地址、收货地址、聊天记录、搜索记录、得知客户是否具备按时还款的条件,进而为金融公司提供价格高昂的定位、“告密”等服务,这涉及了严重的用户的隐私泄露,行业乱象愈演愈烈。由此也逐渐引起了官方的严肃“问候”,“大数据”一词也更具备了多种的色彩。

众所周知,金融的核心环节是风控,而作为大数据行业不仅连接着用户,还面向现金贷公司,是现金贷机构的重要合作伙伴。通过第三方数据的服务,一方面能够为现金贷风控提供安全参考,但另一方面一旦数据被贩卖、泄露,就会对用户的隐私造成侵犯,也容易将大数据风控行业推向深渊。

有媒体称,在现金贷行业,很少有老板会花心思自建风控模型。大多数老板在项目上线前会直接从系统商那里买风控系统,价值在2万元到8万元之间,而第三方数据公司经常会借调用户数据,而这自然违规。

《每日财报》注意到,目前很多涉及爬虫业务的数据公司都已经暂停或调整服务。

大数据“震荡”事件不仅在国内,在国外同样引起轩然大波。比如去年Facebook被曝超5,000万用户信息被政治数据公司“剑桥分析”获取并利用,帮助2016年特朗普团队参选美国总统,这一事件引起了国际社会的广泛关注,也让人们意识到隐私保护在大数据面前是多么脆弱。

大数据行业何去何从

但在当下过度解读政策、唱衰行业或是一味呼吁监管松绑都难免有失偏颇,对长远发展无益。换个角度看,如能借此次整顿重新审视大数据价值,理清不同市场主体的权责,明确数据采集、应用的规范,或许整个行业将迎来换挡出发的窗口期。

我们需要看到的是技术的发展不能因噎废食,面对数据应用,企业要寻找发展与安全的动态平衡点,并结合具体场景去深度理解数据的必要性和安全性,让大数据风控有健康发展的空间。

消费金融突飞猛进的近十年发展历程中,大数据的应用革新了传统金融机构的风控水平和效率,其应用价值已被充分验证。另外传统金融服务解决不了信息不对称的问题,所以必须引入替代数据。

根据亿欧智库2018年11月发布的《2018中国智能风控研究报告》,截至去年年底,573家金融风控企业获得投资金额超过1000亿元,其中3成企业获得三次及以上的投资,可见市场潜力巨大。

据新流财经此前报道,大数据头部公司的盈利能力还是很强,行业某头部公司2016年至2018年的营业收入分别为6066万元、2.61亿元、5.42亿元。

但是这一切要在合法、安全使用数据的底线上。

其实大数据技术在法律、政策上从未被明令禁止,本身是中立的,但是需要理清,大数据技术是中立的,而大数据企业不是中立的。大数据可以用来实现精准推荐,也可以实现精准骚扰;可以实现网络诈骗,也可以实现风控反欺诈。越是强调科技中立,就越要强化对科技公司及使用者的监管与规范,唯有如此,才是捍卫科技的中立性。

如今,每個人的生活都被数据定义,从用户信息授权第一道关口的失守开始,再到数据的泄露、滥用、买卖,那些缺乏底线、对数据的收集和使用毫无约束,更甚者游走于法律灰色地带的“问题企业”,都是在用整个行业的长远发展来为它们的短期利益买单。

事实上,在合理的数据应用范围内,解决用户隐私保护问题的技术手段有很多,比如说数据脱敏、权限管控、加密存储等。只有做到数据应用的规范化,才能区分开真正的大数据风控企业与贩卖流量、倒卖数据的“大数据公司”,使数据价值聚焦于数据的整合、挖掘、分析和运用,并延伸至数据分析、人工智能、大数据平台能力、与5G结合等方面,更好地发挥大数据风控在金融领域的价值。

(来源:每日财报)

猜你喜欢

爬虫用户
您拨打的用户已恋爱,请稍后再哭
基于用户和电路的攻击识别方法
基于Python的网络爬虫和反爬虫技术研究
Python反爬虫设计
大数据爬虫风暴
基于Scrapy框架的分布式网络爬虫的研究与实现
谁抢走了低价机票
信用卡资深用户
带你进入网络爬虫与反爬虫的世界
Twitter用户增长未达预期