APP下载

大数据打防多发性盗窃案件探析

2015-08-16张晟

湖北警官学院学报 2015年10期
关键词:数据挖掘大数据

张晟

(武汉市公安局 洪山分局,湖北 武汉430070)

大数据打防多发性盗窃案件探析

张晟

(武汉市公安局 洪山分局,湖北 武汉430070)

【摘要】多发性盗窃案件在刑事发案中始终占较高比例,其高发低破态势制约了刑事案件整体破案率的提升。大数据的发展应用为打防多发性盗窃案件创造了有利条件。在打击犯罪层面,公安系统各类大数据信息平台为实现“由人到案”侦查模式的精确打击提供支撑。在防范犯罪层面,采用数据挖掘技术分析多发性盗窃案件发生的时空规律,预测重点时段、重点区域盗窃发案可能性,有针对性地进行巡逻防控,从而实现降低多发性盗窃案件的数量。

【关键词】大数据;多发性盗窃案件;数据挖掘;犯罪预测

动态化信息化社会条件下,人流、物流、资金流和信息流激增,刑事盗窃案件在这种大环境下持续高发,给公安机关打防工作增加了不少难度。坚持问题导向,以新一轮公安改革情报导侦为要求,切实提升群众安全感和改革获得感,研究新形势下打防多发性盗窃犯罪有较强的现实意义。本文针对多发性盗窃案件,利用大数据技术构建打防策略并应用于实际,阐明大数据打击和防范犯罪两者之间的关系,以期对多发性盗案的侦查与防范有所裨益。

一、多发性盗窃案件的发案特点及打防挑战

盗窃,是以非法占有为目的、秘密窃取公私财物的行为。多发性盗窃并非法律概念,而是公安机关在侦查实践中因需要而产生的集合概念。本文所界定的多发性盗窃案件是指扒窃、盗窃电动车、入室盗窃、盗窃车内财物、盗窃机动车油料等盗窃案件。多发性盗窃案件具有如下特点:

第一,侵犯法益复杂。盗窃罪规定在我国刑法264条,其侵犯法益为公私财物的所有权。但是,群众身边多发的入户盗窃、扒窃等案件,实际上侵犯的是双重客体,不但侵害财产权益,而且侵害公民的居所安宁与社会秩序。第二,案件高发低破。盗窃案件发案数常年高位运行,占刑事案件总数的75%,而破案数只占发案数的20%左右。第三,作案人具有流窜性、团伙性、职业性特点。2014年,武汉市洪山区共打掉盗窃团伙44个,团伙盗窃嫌疑人占总抓获人数27%。抓获盗窃嫌疑人545人,其中绝大多数为外省市籍流动人口。盗窃嫌疑人多有前处记录、专业手法,破获的2157起案件中有240宗系列案件,呈现职业化特点。第四,发案地点多为街头路面。第五,理性犯罪。美国学者Cornish与Clarke于1993年提出了理性犯罪抉择理论,认为犯罪出于意志和功利,其选择与费力程度、收益、成本代价有关。盗窃是一种典型的理性犯罪,表现有三:一是作案人每次作案脑中有较为明晰的进出路线、犯罪计划、选取目标标准;二是多次打击处理后,反侦查能力明显增强;三是在理性犯罪作用下,发案时空规律较强。以扒窃为例,从时段看,节假日案发数高于平时;从地段看,发案集中在商圈、学校圈、医院圈等人口集中地带。

多发性盗窃案件高发低破,实践中打防此类案件常常陷入僵局,究其原因主要是以下几个方面:

一是管控流动人口基础工作薄弱,导致打击犯罪成本倒挂。当前打击多发性盗窃案件不力是动态化人财物大流动的社会背景与警力不足矛盾作用的结果。一方面,市场经济下的城镇化、城乡一体化,流动人口大规模、多领域、多区域、高速度奔涌,公安机关对流动人口管理失范、情报滞后、控制乏力,人口基础工作反哺侦查破案力度小。另一方面,我国是一个发展中国家,财力供养警力有限,面对庞大数量的盗窃发案,公安机关无法支付警力、物力、财力、精力成本。二是侦查机制与新形势下盗窃案件不适应,信息化引领作用不强。建立在以已发刑事案件为工作对象、以“由案到人”为主要侦查模式的传统侦查机制已经与动态化条件下盗窃案件特点不相适应。同时,公安机关对重点人员、高危人员、流动人员落地查控普遍存在能力瓶颈,信息化对打击破案作用有限,导致当前打击盗窃犯罪效率低、民警疲于应付。三是社会面巡控防范科学性、针对性不强。多发性盗窃案件发生于街头路面,加强社会面巡控是防范多发性盗窃案件最有效的基础工作。目前,社会面巡控时段选取主要依赖巡逻民警的工作经验,随意性较大。

二、大数据打防多发性盗案的体系建构及特点

多发性盗窃案件发案数量大,影响百姓安居乐业,必须引起我们的重视。根据多发性盗窃的一般特点,结合我国其他省市先进经验,打防多发性盗窃案件要坚持“打系列、打团伙、打规模、强支撑、重防控”的总体建构思路。[1]“打系列”是要“破一串”,打出高效益。盗窃的作案次数和赃物价值是量刑依据。“打团伙”是要“打一伙”,端掉全组织。盗窃犯以盗为业,多数组织完善,分工明确。“打规模”是要“稳一片”,基于信息化作战的高效能,根据警情上升决定批量打击特定犯罪。打系列、打团伙、打规模是打击战术层面的建构要求。

“强支撑”基于打击技术层面。从目前侦查手段看,主要是技术侦查、网络侦查、刑事技术、视频侦查、情报信息化对刑事侦查的支撑作用。“重防控”基于基础层面,是要跳出刑侦来发展刑侦,通过针对性加强人防、物防、技防等基础工作,以实现对多发性盗窃案件发现得了、防控得住的目标。

图1 多发性盗窃案件打防建构

大数据,是一种先进的信息技术,是指在各种类型的海量数据中,运用各种方法快速获得有价值信息用于决策的技术。[2]相比传统方式,大数据在打防多发性盗窃案件中具有以下特点:

图2 大数据分析流程

一是理念先进,实用性强。人类社会已进入大数据时代。研究大数据打防多发性盗窃案件,目的是将这种先进科学技术转换为公安战斗力、破案生产力。大数据打防多发性盗窃案件创新处在于:在打击犯罪中,将传统刑侦工作中的刑嫌调控、摸底排队与数据分析相结合,充分发挥各种大数据信息平台在破案打击中的支撑作用,将“由人到案”精确打击的侦查模式推向成熟。在防范犯罪中,采取数据挖掘决策树算法定量分析已发案件,发现发案规律,从而确定巡逻防控的重点区域、重点时段,有针对性地开展巡逻。

二是功能局限。公安工作的基本方针是专门工作与群众路线相结合。大数据技术是公安机关打防犯罪的有力武器,可以有效缓解警力紧张、抓手不足的问题。但无论大数据技术多么先进发达,都不能解决侦查工作中的所有问题,不能取代侦查员的主体地位,不能削弱警民之间的鱼水联系。

三、基于“由人到案”侦查模式的大数据犯罪打击

信息化条件下侦查破案的根本方法是将特定人的身份背景信息、活动轨迹信息与案件信息进行碰撞。[3]由人到案,就是以特定人为源头和工作对象,以查明特定人背负的刑事案件为目的的一种侦查模式。笔者将信息化条件下的“由人到案”划为三步——筛刑嫌、查轨迹、碰案件。

(一)筛刑嫌

刑嫌,即刑事犯罪嫌疑人员,是指具有犯罪可疑迹象,但尚未发现掌握其已进行犯罪的事实,不能对其展开立案侦查的人员。[4]筛刑嫌,是指根据已掌握犯罪的前科人员、高危人群、行为特征等条件,从已知走向未知,筛查发现出有待查证的重点人员。借助手机热点(记录项为手机串号、手机卡串号、时空轨迹信息)、警综平台(记录项为已打处人员手机SIM卡通讯录)、公交IC卡(记录项为IC卡串号、时空轨迹信息)等大数据平台,笔者在实战中总结了以下五种方法筛查刑嫌人员。

一是利用已打处人员手机通讯录筛刑嫌人员。盗窃犯,特别是惯盗,基于经年累月的盗销,其盗窃团伙成员之间已经形成了一种熟人关系网,而这张网就反映在他们的手机通讯录中。大量交叉比对已打处的盗窃犯通讯录,碰撞共同关系人,就不难筛查出市内流窜性弱、不频繁更换手机号的重点人员。

二是利用盗窃犯反常用机习惯筛刑嫌人员。不同于常人,刑嫌人员爱换手机号。基于这种反常性,我们可知辖区内谁最爱换手机号,谁就是“高危”。关联比对热点记录的手机串号与手机卡串号,就不难筛查出市内流窜性弱、爱换手机号的刑嫌人员。

三是利用手机卡串号号码段对应高危地区筛刑嫌人员。手机卡串号同手机号一样,由于其号码段记录了号码归属地,通过分析辖区内特定时间活跃的高危地区手机号,就能及时发现职业流窜盗窃犯。

四是利用车扒人员反常使用公交 IC卡筛刑嫌人员。不同于常人,车扒人员以坐公交车为职业,在乘车上呈现明显的无序性,通过分析IC卡轨迹信息,就不难筛查出活跃在公交、地铁的车扒人员。

五是利用公安司法机关重点人员库筛刑嫌人员。公安机关“七类重点人员”库和司法机关戒毒人员、社区矫正人员库掌握的重点人员都具有犯罪的高概率。这类人员也必须纳入刑嫌人员分析范围。

(二)查轨迹

查轨迹,是指以寻找侦查线索为目的,综合运用侦查措施和侦查手段落地查控刑嫌人员在辖区内的各种活动轨迹。

查轨迹要解决两个问题:一是管辖问题。留有轨迹就有管辖权。二是刑嫌人员定性问题。定性就是要根据轨迹判断刑嫌人员是正常人还是嫌疑人,是盗窃,还是销赃、贩毒。

(三)碰案件

碰案件,是指将刑嫌人员的各种轨迹与已发案件进行碰撞,借以发现辖区有哪些案件是刑嫌人员所为。主要是运用视频侦查和刑事技术手段确定。

综上所述,大数据进行“由人到案”的精确打击,继承了传统刑侦摸底排队的基本方法,利用时间、空间、刑嫌人特征、交往关系、反常表现等条件筛查可疑人员,通过各类大数据信息平台查询重点人员活动轨迹,结合已发案件性质、现场、嫌疑人特征逐项查实,从中确定犯罪嫌疑人,破获案件。

四、基于数据挖掘决策树算法的大数据犯罪防范

“二十公”会议以来,全国公安机关不断深入探索社会面巡控,逐步形成了以网格化为勤务布局和责任主体的巡控体制。大数据就是要助力网格化巡控,让数据“多跑路”,让警察“跑对路”。通过采取数据挖掘决策树算法定量分析已发盗窃案件,预测未来发案,针对性地在重点时段、重点区域开展巡逻,最大限度挤压犯罪空间,压降警情少发案。

从概率论和数理统计学分析,在一定条件下具有多种可能结果的现象可视为随机事件。犯罪,既是一种社会现象,也是一个在一定自然环境和社会环境下发生的随机事件。随机事件遵循概率论基本定理——大数定理:随机事件的出现频率将会在某数值附近波动,随着样本次数的增加,随机事件的频率近似于它的概率。借助研究大量已发盗窃案件,可以得到概率;借助概率,我们可以寻求犯罪规律,预测未来发案。大数定律是实现预测的理论基础,而决策树算法则为我们从大量发案中求得概率提供了方法。

图3 大数据防范犯罪范式示意图

决策树算法,是数据挖掘最常用的算法之一,是一种基于分类模型预测随机事件的算法。决策树采用自顶向下的递归方式构造,以实例为依据,从一组无序、无规则的实例数据中推理出用于决策树形成的分类规则,并根据分类的结果进行预测。该算法分为两步:其一,基于以前的数据建立一个分类模型,称为分类器。其二,确定该模型的准确率,是否可以接受,若能接受就可用于预测。[5]

(一)利用犯罪环境学理论构造分类模型

犯罪环境,欧美国家已有研究。要真正做到情报信息主导警务,第一步就是要能够解释犯罪环境。[6]个体行为是一个人与他的周围物理环境交互作用的结果,而这些物理环境可能会给个体创造不同程度的犯罪机会。

分类,是决策树算法的核心内容。公安机关研究大量罪犯在盗窃动机驱使下,某具体场所在哪类季节、时段、环境最容易发生案件,最受罪犯青睐。利用犯罪环境学,研究案件在何种环境高发。

由此可见,犯罪发生存在四维条件,即有犯罪动机的犯罪人、合适的作案目标、缺乏防范犯罪的力量以及环境时空背景。[7]四条件中,目标、防范力量、时空反映犯罪发生的客观环境,犯罪人体现犯罪发生的主观意图。犯罪发生的主客观方面不是绝对对立的,而是互相渗透的。传统刑侦从客观的现场分析入手,调查走访犯罪发生的时间、地点、被害人,通过痕迹物证刻画犯罪人,确定侦查方向,最终破案。因此,研究犯罪发生的客观环境、社会环境,在重点区域时段加大防范力量,是可以达到减少犯罪效果的。

面对形形色色的盗案,目前还没有一个统一范式描述犯罪发生环境。但侦查实践总结出时间描述的时刻、星期、月份、照明、天气,地点描述的交通便利、人口密度、房屋结构等影响案发有较大权重。[8]

(二)利用ID3算法构造决策树

实验分析某一线城市重要商圈,其地理位置处于地铁出口和两条主干道交汇处,是集交通、商业和创意产业于一体的“黄金十字带”。在这个300M× 200M的矩形网格内,商业体量达到39.7万平方米,集中了群光广场、乐天城、珞珈创意城、新世界百货四家商场。商圈常年人流不息,购物人群又多为防范意识薄弱的学生,导致扒窃案件高发。通过研究该网格内扒窃案件的特点,以点带面,解析决策树算法在犯罪预防中的运用。

图4 某一线城市商圈示意图

某年元旦期间9天内的商圈扒窃案件,这里的商圈是指围成的街道及商场内部,扒窃案件仅针对街头扒窃,不包含公交车、地铁等车扒。把这四家商场组成的商圈作为一个整体,排除了交通地段、地理的影响,仅分析该处扒窃案发的时段(2、3、10日为法定节假日,工作日17点后为休息时段)、商场内外、天气三个变量。10起案件如下:

表1 警综平台录入案件表

案情加入天气变量后构造训练集:

表2 构造训练集

信息论的信息熵概念解决了信息的量化问题。信息熵的计算公式为

决策树算法预测的准确性取决于分类精度。

分类精度=正确分类的实例个数÷实例总数。

要正确分类,就要定量计算出每个变量对随机事件发生影响大小。信息增益就是用于衡量每个变量对事件发生影响大小:

图5 ID3算法生成决策树示意图

决策树可以转换为一组IF-THEN规则,自上而下从根节点到叶子结点的每条路径对应于一条 IFTHEN规则。图5所示决策树转换为如下规则:

IF(天气=晴)THEN发案=YES

IF(天气=雨and地段=马路)THEN发案=NO

IF(天气=晴and地段=商场内and休息时间=是)THEN发案=NO

IF(天气=晴and地段=商场内and休息时间=否)THEN发案=YES

决策树ID3算法构造的决策树直观呈现了犯罪预测过程。但该决策树存在以下问题:一是训练样例太少,分类粗糙,可能有噪声或不具有代表性,存在过度拟合问题;二是ID3算法虽然有效,但该算法通常偏向取值较多属性,不是最优算法。基于模糊ID3算法的(FID3)改进算法构造的模糊决策树在预测准确率、扩展能力、易理解度上更优越、更可取。

五、大数据背景下打击与防范犯罪的关系

从公安业务角度来看,大数据背景下的犯罪打防关系继承传统,二者是打防并举、以防为主、相辅相成、缺一不可的关系。打击是立竿见影的治标之举,防范是釜底抽薪的治本之策。打有利于防,没有“打一伙、破一串、稳一片”的精确打击,结果必然是发案居高不下,防不胜防;防有利于打,不去有针对性地做好防范工作,打击犯罪就丧失了驾驭局势、控制局面的主动权。在打防并举的过程中,必须坚持以防为主的方针。人民群众呼唤和谐安全的社会环境,不仅要求凶手归案,案件破获,还要求减罪、减损、减赃、少发案,把犯罪遏制在萌芽阶段。

万事万物统一于哲学。从哲学视角看,大数据背景下的打防犯罪首先是一个对立统一关系。打击犯罪要求尽可能穷尽技术支撑,而防范犯罪不需要借助手机、视频、网络、调查走访等任何手段措施,只需要如实录入案件。因此,从实现路径上看,两者是对立的。同时,要认识到大数据背景下的犯罪打防具有统一性。一是结构的统一性,打击和防范本来就是同犯罪活动作斗争的必要组成部分,部分与整体的天然关系决定了打防犯罪是和谐统一的。二是相互作用的统一性,打防之间相互渗透、相互补充。三是来源的统一性,刑事案件现场是犯罪行为的发生地、犯罪证据的保留地、犯罪信息的储存地。[9]从打击层面看,要实现“由人到案”,要求嫌疑人的轨迹与案发现场时空相印证,嫌疑人的特征与案发现场痕迹物证相吻合;从防范层面看,决策树算法正是从大量的案发现场中获取信息,整合归纳,从或然走向必然,实现预测防范犯罪。其次,大数据背景下的打防犯罪体现否定之否定的认识规律。侦查员在打击犯罪时,借助已有的侦查经验、侦查理论,在办案中不断修正,熟练运用,实现对犯罪规律认识的第一次飞跃。在预防犯罪时,借助计算机算法,在计算中发现特征,分析趋势,颠覆性地发现犯罪规律的新知识,实现对犯罪规律认识的又一次飞跃。

六、结语

作为最古老的犯罪类型,多发性盗窃案件的打防在大数据时代面临着新机遇。在继承传统侦查的基础上,坚持社会治理能力现代化与社会公正法治价值体系的双向统一,深度试水情报信息主导警务,使警务部署更具科学性、巡逻防控更具针对性、侦查破案更具精确性,更好地打防多发性盗窃犯罪,是本文立意的初衷。

【参考文献】

[1]李蕤.大数据背景下侵犯财产案件的发展演变与侦查策略探析[J].中国人民公安大学学报,2014(4).

[2]易向军.大嘴巴漫谈数据挖掘[M].北京:电子工业出版社,2014:13.

[3][9]尚武.我的刑事侦查观[M].武汉:湖北人民出版社,2012:17-82.

[4]张新枫.刑事侦查教材[M].北京:警官教育出版社,1999:33.

[5]吴昱.大数据精准挖掘[M].北京:化学工业出版社,2014:27.

[6][美]杰瑞·拉特克里夫.情报信息主导警务工作概述[A].

[7][8][美]罗斯姆.地理学的犯罪心理分析[M].李玫瑾译.北京:中国人民公安大学出版社,2007:115-120.

①哈特利为10对数为底的信息熵单位。

【中图分类号】D631.2

【文献标识码】A

【文章编号】1673―2391(2015)10―0033―05

收稿日期:2015-05-19责任编校:边 草

猜你喜欢

数据挖掘大数据
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘在高校图书馆中的应用
基于GPGPU的离散数据挖掘研究
高级数据挖掘与应用国际学术会议