APP下载

大数据下的串并案分析

2019-09-10李蕤

青年生活 2019年8期
关键词:案件分析

李蕤

摘要:大数据时代,信息的探索挖掘和联系分析愈发加强。作为公安机关最重要的侦查方式之一的串并案侦查需要获取足够的关注和进步。传统的串并案方法耗费大量的人力物力。如果依托人工智能大数据的进步,侦查人员借助高效的串并案分析方式,将为打击犯罪势力,守护人民群众的美好生活作出巨大的贡献。

关键词:串并案;大数据;侦查

引言:

一、迎接大数据时代下的司法领域革新

25年前技术变革是信息通讯技术的开端。电子信息技术的普及和应用推开了第五次科学技术革命之门。历史上每一次技术變革其实都分两个阶段。第一个阶段是导入期,这是技术的引入阶段,在这一时期新技术得到快速发展,并在主要领域得到广泛应用。继而进入第二个阶段,拓展期,在这个阶段,人们会在这个技术的基础上,部署很多创新应用,新技术的潜力得到充分发掘[]。如今我们正处于这次革命的转折点,从导入期到拓展期的转折点。而导入期中收集的大数据将成为推动拓展期到来的核心动力。

深化大数据应用,已经成为稳增长、促改革、调结构、惠民生和推动政府治理能力现代化的内在需求和必然选择。[]司法领域是打击犯罪,维护社会稳定的重要环节。把人工智能、大数据与司法体制改革相结合,将会给司法领域注入强大的创造力,给司法工作带来极大的突破。大数据时代,我们可以通过去量化过去不能量化的信息,使用精妙的统计学方法分析这些信息成为可能。寻求先进的科学技术倒逼出新的工作方式,让司法领域工作人员不能报守传统工作模式的残缺,而是以积极的心态应对大数据与人工智能带来的新型犯罪方式等问题的挑战,并积极利用新技术解决遗留问题,攻克难关。

二、打好大数据下串并案件的基础

(一)串并案侦查的含义

串并案侦查,指的是对系列案件中的相关信息特征,包括作案手法、痕迹、物证、时间和空间等的对比、评估和分析后,认定为是同一犯罪主体所为,从而将系列案件串联起来进行侦查的方法。其中认定两个案件为同一主体所为,则称为并案;两个以上系列案件为同一主体所为,则称为串案。与串案和并案相联系的还有一种是“窝案”。所谓挖出一个,带出一窝。所以窝案一般指的是群体性作案。这一群人在一个群体组织里具有相关关系、利益分赃等特点。同时,其作案往往是一串,所以又被称为窝串案。如贪污贿赂窝案、串案的典型表现形式为案中有案、案后藏案、案案相连。

串并案侦查并不是一种固定的侦查方式,而是公安机关在长期的实践中摸索和总结的一种有效的方法。做好串并案侦查能够收到抓一人破多案、以小案破大案、破一案带一串、破一串扫一片的良好效果。

不要将串并分析与相似但仍有所不同的“并案分析”混淆。并案分析在这种系统中就像分析者之笔记本,在各个姓名、电话号码、交通工具等间核查它们之间的联系和各自内部的联系,而串并分析只是考虑犯罪之间相似的可能性[ ]。随着案件形式的多样性,犯罪分子反侦察能力的提高,大数据信息的复杂度的增加,串并分析也应打破传统的方式,与时俱进。

(二)转变大数据下串并案件的思维模式

大数据时代,人们的思维方式逐渐发展形成网状,向总体思维、容错思维过渡。与精确性思维、因果关系相比,容错思维和相关思维更能够对数据的搜索、挖掘以及进行可视化的描述分析更有利。

转变思维模式,重要的是充分利用潜在相关关系。正如维克托所说:“大数据时代,我们的思想发生了转变,不再探求难于捉摸的因果关系,转而关注事物的相关关系。’’因此,侦查人员由研究因果关系转向学习相关关系数据的研究与应用方法,善于从相关关系数据中寻找案件侦破切入点或突破口,是串并案件乃至侦查数据思维方式实现过程中的一项重要任务。相关关系又被称为联想关系,在相关关系中,每一方的数据变更都可能会影响到对应数据的变化,不同于因果关系的确定性的分析结论,相关关系主要应用于预测各种可能性的有无。大数据下的串并案分析也主要是通过这种相关度鉴别与推送,将精确与容错相结合,帮助侦查人员获取与案件相关的更多线索,多方位收集零星的证据,为打开案件的突破口找到通道。

洛卡德物质交换原理是由法国著名的刑事侦查学家、司法鉴定学家和警察技术实验室的先驱埃德蒙.洛卡德于20世纪初撰写的《刑事侦查的方法》一书中提出。洛卡德认为,犯罪行为本质上来说是一个物质交换的过程,犯罪行为人作为一个物质实体在实施犯罪的过程中总是跟各种各样的其他物质实体发生接触;因此,犯罪案件中物质交换是广泛存在的,是犯罪行为的共生体,并且不以人的意志为转移。简单来说,就是但凡两个物体发生接触,必将产生物质转移现象,会带走一些东西也会留下一些东西。但是这些证据并非存在于数据空间之中。我们不仅要在物理空间找传统的证据,更重要的是在数据空间中寻找案件进行的各个阶段的存在痕迹,并进行串并案分析。对任何工具和地点在数据的系统中都有可能成为串并案的潜在关联点。互联网+司法,将会碰撞出新时期的案件侦破途径驱动模式,司法工作的效能。

(三)切实打好硬件和软件基础

公安部金盾工程与公安网相结合进行的全国公安快速查询综合信息系统和城市公安综合信息系统建设、公安业务系统包括治安管理、刑事案件、出入境管理、监管人员、交通管理、进度信息系统等为依托,为串并案侦查提供了一定的硬件和软件支撑。但是难题依旧存在。一是,跨系统跨数据库的关联分析难度很高;二是,共享机制缺乏,数据信息的应用仍存在边界,整合效果不佳。收集数据,建立模型,完善串并案分析的系统设施仍任重道远。

收集数据,搭建大数据平台,进行智能检索。运用知识图谱技术实现数据关联,提供智能检索多维数据关联展示。可以根据姓名、电话、特征等关键词,检索出组织、案件、图片等信息进行主题分析。还可以进行人员甄别:制定用户标签体系,构建人员全景画像及关系图谱。

建立多维度模型。以洗钱罪为例,除了海量的交易数据,还可以结合社交链行为数据,根据其发生的时间、交易特征、刷卡商户附近居住的人群社交量的数据,以及一些涉案人员发生交易的特定客户的行为特征。不过总会有一些漏网之鱼,不法分子将零散的把钱存入银行,最后汇总到一个账户上。但如果洗钱网络足够庞大的话,支点的存钱人员相互之间可能没有任何关系和交际。这就需要利用多维度数据反复验证、比较、不断优化。并且,借助机器学习、深度学习技术,不断训练、完善模型,加入新纬度的数据来提高模型的准确性。比如案件串并,将案件数字化,形成每个案件的多维向量特征。对每个案件的多维向量特征进行维度约简;计算待分析的案件与向量约简后的数据库每个案件的相似度,找出数据库中和待分析案件有关联的串并案件。建立异常聚集模型,通过曾涉案的人员的上网的信息迅速定位到其地点,这个地址可以帮助我们很快地匹配人口统计数据。如果多个曾涉案人员突然聚集,或者有出境行为,即可预警,提前进行部署排查。高科技犯罪背景下,无论是在刑侦中的缉毒、反恐,还是经侦中的反洗钱、反诈骗等领域,无不需要大数据解决方案来支撑。公安大数据,会越来越精准地找到“他”。

三、逐步加强应用大数据串并案的实践探索

公安侦查串并案件的数据挖掘技术,也越来越引起国内外学者的显著关注,以文本字段为主逐渐演变为关键字识别,进行数据分析,对案件进行可能的串并联分析。同时,随着高科技的发展和科研学者们辛勤的努力,视频图片中人脸技术识别和通讯痕迹辨析进行的串并案侦查也取得显著发展。

(一)简单模型的建立

根据不同类型的案件分析建立不同的子根据不同类型的案件分析建立不同的子系统模型。以多发性侵财案件自动识别串并平台处理的简单流程为示范。但数据库应致力于建立综合总括的跨系统数据信息系统。

1. 数據采集

侦查人员日常接警、处警,将案件相关信息录入系统平台。

2. 数据预处理

将输入的条件转化成为计算机能够识别计算的数字编码。

3. 聚类分析

对输入的规范化数据进行分析,得出一个或多个具有若干相同或相近的规范化数据条件的簇。

4. 人工决策

对聚类的影响因子进行调节,也就是要选择相似度有多高的数据可以作为一个聚类的分类标准。

(二)大数据串并案实践探索成效

广东省中山市民警张福辉利用自身的实践经验与大数据分析相结合,创建了张福辉串并案分析模型,在实践中做到了将大量隐藏不易被发现的信息和证据线索挖掘分析出来,以可视化的方式高精准度高效率的展现出来。福辉模型分为:从人到案、从案到人、从人到人、批量串并、自由串并、任务串并、跨区域串并等多个功能模块。与以往的串并案耗费大量的人力物力财力进行人工比对不同的是,新的模型以关键字为核心进行数据采集和分析,大大提高工作效率的同时降低了使用门槛,与人工智能结合的过程中,大数据源随着实践发展不断扩展,也能够基于统一的数据模型拓展收集更多的情报线索,扩大案件潜在的串并案范围,增强使用效果。以广东省中山市的大幅度推广为起点,福辉模型已经在广州多个市县,以及甘肃等省份进行推广试用,已破获众多案件,取得显著成效。

(三)相互配合中大数据侦查串并案效用发挥最大化

更好的串并案是各部门的相互配合。某市原国税局曾对辖区的企业开展大数据分析后发现,有十几户经营塑料的公司都取得了失控发票,数额巨大。表面资料显示,这十几家的企业法人不同,地址也不一致。但经过数据比对,部分企业取得的失控发票的开票企业相同,一些企业向同一家企业开具发票。摸排后,发现这十几家企业实际上由一人控制,有虚开发票的重大嫌疑。原国税局启动税警合作机制,提请公安部门提前介入,联合专案组制订了统一部署、统一开展检查行动的方案。税务与公安部门发挥各自专业优势,利用国家税务总局的云平台及电子底账系统,分析涉案企业的纳税申报、发票流等信息,挖掘受票企业更多虚开增值税专用发票的线索,及时跟踪,并从货物流、运输流、资金流等方面调查取证,固定证据,确定了收网抓捕范围。

四、树立正确的大数据串并案价值观

(一)积极学习创新,寻找串并案新路径

大数据侦查是侦查机关顺应信息社会发展潮流的明智选择,其深度应用既有助于提高犯罪预防的精确性,提升警力配置效率,也有助于增强侦查取证的科学性,提高破案效率与破案能力,带来用信息换安全的社会效果。从权利保障的角度看,大数据技术的应用将无所不在的记录与数据经过分析、挖掘得出更为客观、精确的证明犯罪过程的材料,客观上有助于改变长期以来侦查机关对口供的严重依赖,可以降低对严重干预公民隐私权的技术侦查的依赖,带来用信息换权利的法律效果。对于大数据侦查带来的侦查效能提升与侦查模式转型的积极效果,应当充分肯定。

(二)大数据侦查法律控制的必要性

大数据侦查尚处于初始应用阶段,其双刃剑效应亦同时凸显,执法司法实践中已然暴露出一些问题,对一些基本权利和法律价值形成挑战,及时对其进行法律控制具有必要性。首先,大数据侦查的推广适用标志着隐私逐渐受到限制,甚至有消亡的危险。大数据侦查植根于公民为参与信息社会生活而不得不交出并汇集的海量信息,必然带来大规模监控的效果,即全体公民的各种信息都成为了其分析对象,这是一种不以犯罪嫌疑为前提的广泛监控,全体国民甚至全球民众都可成为潜在的侦查对象,大量无罪公民的个人信息在大数据侦查的过程中被储存、比对、挖掘。大数据侦查的广泛应用促使侦查权干预权利的类型发生转换与升级,侦查行为的对象由传统上的人身权、财产权转向平等权、隐私权、人格尊严、精神自由等基本权利和自由,权利干预的类型更加无形化、抽象化,在权利体系中的地位更接近权利构造的顶端。权利本身的无形性、抽象性令干预权利的侦查行为更难识别与感知进而导致权利的救济困难;权利位阶具备更强的政治性,则意味着与国家权力的冲突会更为剧烈。在这个意义上,对大数据侦查进行法律控制是维系国家治理体系正当性的必然要求。如果任其发展,此类侦查方法将会加剧社会不平等的裂痕,抑制社会的活力与创造力。

(三)避免大数据串并案侦查避免侦查误区

数据也可能犯错,错误原因主要源于两个方面:一方面大数据技术通过机器学习与人工智能,根据侦查人员设计的各种模型对数据进行挖掘,而各种算法与分析模型的来源只能是侦查经验的人为积累。人类侦查经验的局限性会照搬给机器算法,大数据的预测功能同样会产生错误。在模型建构过程中,侦查人员的自由裁量类似问题在大数据应用程度较强的美国普遍存在,大数据侦查过程中,对于社会底层人群特别是有色人种的执法歧视被进一步放大,比如在大麻毒品犯罪打击过程中,尽管白人与黑人具有相同的吸食比例,但黑人犯罪嫌疑人的犯罪数据更多地被收集并存入数据库,其结果是更多的黑人犯罪嫌疑人被警察抓捕。

避免侦查误区。无论是警方自建的各类数据库,还是利用社会第三方机构的数据库,司法实践已经反复证明,数据瑕疵与质量低下的数据经常导致错误的关联,甚至对公民自由带来直接损害。依靠大数据进行串并案绝对不是分析员能够使用的精确的工具,只是在找出案件的相似之处后,对相似点的重要性进行评估时使用的一种技巧。案件是否相似,是否需要进行串并还需要放在案件之间前后的联系性中,综合考察,客观评价。在对相似性的重要性进行评价的时候,外界影响因素也应该被考虑在内。例如,电话登记人分析结果表明,相关案件中被联系的人都姓陈,这一结果在欧洲是十分有价值的,但在中国恐怕就毫无意义了。

四、结语

马云说,互联网还没搞清楚的时候,移动互联就来了,移动互联还没搞清楚的时候,大数据就来了。依靠数据挖掘等技术发现数据之间的关联关系和隐含规律,找到合适的关联物,然后通过关联物的变化来判断现象之间关联关系的强弱,依照关联性强弱对关联进行赋值,建立加权算法模型,最后输出结论。是大数据下互联网加司法的重要手段。公安部的案件统计中发现,案件主要分为两类,一类是重大恶性案件,已经形成了多部门联合作战的趋势。二是小案,主要是侵犯财产类案件,每年上升10%,成员分析,80%案件职业犯罪是由20%惯犯所为。大数据把数据整体的连接和呈现出来,通过实践部门和技术部门的联合作战,对案件进行相似性分析,寻找串并案分析的可能性,找到案件突破点。认识到大数据的局限性,勇敢的追求和运用大数据进行串并案分析,是现代司法侦查的应有之义和必然追求。

参考文献:

【1】黄勇主编,科学先锋丛书  科技创新,广西美术出版社,2013.12,第32页

【2】2015年8月 国务院 促进大数据发展的行动纲要

【3】 [美]迪·金·罗斯姆著,地理学的犯罪心理画像,中国人民公安大学出版社,2007.4,第58页

猜你喜欢

案件分析
民航甚高频通信同频复用干扰分析
分析:是谁要过节
数据
回头潮
巴西对华反倾销调查大幅减少 企业仍不可掉以轻心
基于均衡分析的我国房地产泡沫度分析
城管案件
Units 13—14解题分析