APP下载

基于大数据的情报主导警务模式研究

2015-06-18□钟

浙江警察学院学报 2015年3期
关键词:警务情报预警

□钟 政

(中国人民公安大学,北京 100038))

一、大数据概述

(一)大数据的概念和特点。随着物联网、云计算以及社交网络的迅速兴起,大数据时代正式到来。目前学界对于大数据还没有统一的定义。全球知名的咨询公司麦肯锡在2011年6月份发布了一份关于大数据的详尽报告《Big data:The next frontier for innovation,competition,and productivity》,[1]报告对大数据的应用领域和发展前景都进行了详细的分析。维基百科对大数据的定义为:巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工在合理时间内截取、管理、处理并整理成为人类所能解读的信息。

对于大数据的特征,目前学界常用4 个V 来表示。首先是数据体量巨大(volume)。据IDC 报告显示,过去几年全球数据量以每年58%的速度增长,预计到2020年,全球数据总量将为2011年的22 倍,达到40ZB 之多(1ZB=4 万亿GB)。其次是数据类型繁多(variety)。伴随着数据量的增长,数据的类型也发生了变化,除了传统的结构化数据,非结构化数据和半结构化数据正逐渐成为数据的主要类型。数据类型的丰富也给后期的分析处理带来了全新的挑战。再者是数据处理速度快(velocity)。完善的设备和科学的算法使得数据的处理更加迅速,亚马逊基于大数据所推荐的用户偏好商品,在用户点击鼠标的瞬间就能传达给消费者。最后是数据价值密度低(value)。大数据已突破了传统视野下对数据规模的认识,大数据处理技术通过构建算法和模型进而从海量的数据中发掘有效信息,如同“大海捞针”一样。所以,相比数据整体的庞大,有效数据是微乎其微的,这也构成了大数据价值密度低的特点。

(二)大数据的核心价值。大数据的核心价值是预测性分析。2009年,互联网巨头谷歌公司利用5000 万条美国人的检索数据成功预测了甲型H1N1流感的爆发。2013年,Netflix 公司翻拍了《纸牌屋》,利用大数据来预测观众喜好,以此来决定拍什么、谁来拍、由谁演等,该剧一经播出就大获好评。《礼记·中庸》有云:凡事预则立,不预则废。大数据的兴起让预测性分析成为现实,使得人们能更好地为未来做好准备。

(三)大数据的应用现状。目前大数据主要运用在商业领域。如亚马逊基于大数据,通过协同过滤算法计算出消费者的偏好类型,在消费者点击或者购买某件商品后向其推荐类似商品,以此增加产品销量。传统零售商沃尔玛也开始将大数据运用到日常销售中去,通过对商品的销量进行相关性分析,得出了飓风过后手电筒和蛋挞的销量呈正相关关系的结论,在摆架的时候将两者放在一起进而增加营业额。

与此同时,大数据也开始在警务领域崭露头角。如美国加州桑塔克鲁兹市利用大数据构建了犯罪预测系统,对犯罪区域和犯罪时段进行预测并部署警力进行巡逻,大幅度降低了犯罪率。同样,在美国波士顿马拉松爆炸案中,警方通过摸底排队搜集私人录像和照片,并通过社交网站等向公众征集相关信息,最后通过大数据的查询比对,在获取犯罪嫌疑人的图像后成功抓捕了犯罪嫌疑人。随着情报主导警务在世界范围内的普及和运用,大数据必将在情报的搜集和处理中发挥重要作用。目前,国内有关将大数据运用于情报主导警务的研究还很欠缺,有待更深一步的探索和发掘。

二、基于大数据的情报主导警务模式

(一)基于大数据的情报主导警务发展趋势。随着全球经济一体化进程的加速,跨国有组织犯罪、恐怖主义犯罪以及毒品犯罪日益猖獗,传统反应式的以侦查为主的警务模式,囿于属地管辖的限制和警力资源不足的问题,已经很难适应新形势下打击违法犯罪的要求。因此,情报主导警务应运而生。杰瑞·莱特克里菲对情报主导警务的定义为:情报主导警务是一种业务模式和管理理念。[2]有别于传统的警务模式,情报主导警务模式更强调情报研判的重要性,通过情报产品来主动出击,实现精确打击,但在实践中也发现了不少问题:一是部分情报人员错误地将信息采集当作情报主导警务,而忽略了分析研判的核心价值。二是在分析研判的过程中,由于过多地受个人经验的干扰,导致情报产品缺乏客观性和科学性。三是地区之间、国家之间,由于文化和地域的隔离,情报信息之间不能及时共享,形成信息孤岛的现象。而大数据的出现,无疑将全面革新情报主导警务模式。由于技术的升级和设备的完善,基于大数据的情报主导警务可以充分挖掘海量数据中的情报信息,一方面通过构建模型和算法来降低人工干预,另一方面通过构建数据分享平台来打破信息壁垒,加速情报共享。

(二)基于大数据的情报主导警务模式工作流程。大数据时代的到来,在引起社会深刻变革的同时,也给公安工作带来了全新的机遇。大数据技术的日趋成熟,使得情报信息的分析研判更加便捷和精确。对此,笔者对大数据时代背景下的情报主导警务模式进行了构思。(如下图所示)

大数据背景下的情报主导警务模式图

1.数据采集。数据采集是情报主导警务开展的基础。传统的数据采集需要情报人员进行初级筛选,情报人员在拿到数据时需要预先判断其是否为有用信息进而决定是否录入,这种工作方式不仅耗费了大量时间,而且不能避免由于认识缺陷所造成的数据样本不足。而在大数据时代,得益于存储以及处理设备的不断升级,可以撷取总体数据来替代样本数据。因此,公安部门为了得到更为精确的情报产品,可以扩大数据的采集范围。除了传统的公安数据包括旅馆住宿人员数据、在逃人员数据、车辆出入卡口数据等,还应将社会数据和网络数据纳入到采集范围。社会数据包括银行交易数据、通信数据、出行数据等,而网络数据则包括社交网络数据、即时通讯数据、电子邮件数据等。

由于部门和区域之间信息壁垒的存在,公安部门的情报采集工作往往不够全面,更不用说社会数据和网络数据的整合了。然而,大数据技术的出现使得公安部门可以通过搭建数据共享平台的方式,及时采集包括社会数据、网络数据等在内的多方数据。因此,基于大数据的情报采集工作有别于传统的随机样本法,更加注重数据的全面性。

2.数据处理。随着经济社会的不断发展,非结构化数据迅速增长,并取代结构化数据成为主要的数据类型。据统计,只有5%的数据是结构化数据,而剩下的95%则为非结构化数据。这些非结构化数据包括了文本、图片以及视频信息等,难以用二维逻辑表来表现。由于前期数据采集规模庞大,数据的来源多种多样,不可避免地会出现数据重复、数据错误或数据冲突的现象。因此,对数据进行联机分析之前,需要对数据进行清洗、过滤和转换等过程。

3.数据发掘。作为大数据的最初使用者和受益者,国际互联网巨头诸如甲壳虫、微软、亚马逊等都相继研发出了大数据分析工具。基于Hadoop 这一分布式系统基础构架,公安部门同样可以开发出符合情报主导警务需求的大数据分析工具。在数据处理的基础上,通过各种算法的计算得到所要预测的结果。这一过程的挑战在于,由于数据挖掘的算法非常复杂,再加上所涉及的数据体量极其庞大,因此,需要专业的技术人员进行操作。

4.模型预测。通过以上大数据的分析处理过程,进而得出情报主导警务所需要的情报产品。从性质上来说,模型预测结果可以分为犯罪预测、治安防控以及反恐预警等方面。一是在犯罪预测方面,通过数据分析犯罪嫌疑人行为的规律性和关联性等,进而发出预警。二是在治安防控方面,通过对人流、车辆以及住宿人员等数据的联机分析,对治安问题实施有效预警。三是在反恐预警方面,借助大数据分析工具可以共享各国的情报并加以分析,进而有针对性地预警,以此来保障国家和社会安全。

从类型上来看,模型预测结果又可以分为时段预测和地域预测。时段预测通过历史数据建模,再结合现有数据分析比对,预测出犯罪的高发时段。地域预测同样通过大数据的运算,将犯罪区域的分布进行可视化,从而更好地协助警方进行警力部署,提前防范。

5.评估反馈。大数据建模是一个不断矫正和完善的过程,这是因为大数据分析工具与人的关系是相辅相成的。一方面,分析系统需要排除人工经验的干扰,实现数据的客观分析;另一方面,分析系统又需要人工交互来实现算法和模型的不断调整,以适应不断变化的社会治安形势。

前期的数据建模是建立在历史数据和复杂算法的基础之上的,在后期实施情报预警的过程中,一旦发现情报出现错误,需要立即矫正数据模型和算法。这对情报工作人员提出了挑战,他们需要不间断跟踪记录情报预警,发现错误后又要及时反馈给系统设计人员,从而进行调试和矫正。基于大数据的情报主导警务系统,就是通过这样不断循环往复的评估反馈过程逐渐完善,从而实现对情报的精确分析的。

三、基于大数据的情报主导警务模式的发展和完善

大数据作为新兴技术,其在公安工作上的应用还刚起步。因此,为了更好地发挥大数据的优势,需要从以下几个方面进行完善。

(一)树立大数据工作意识。《关于全面深化公安改革若干重大问题的框架意见》中,全面深化公安改革共有七个方面的主要任务。其中一个重要的任务就是要创新社会治安治理机制,并提出了健全情报信息主导警务机制等方面的要求。而大数据时代的带来,为情报主导警务机制的完善带来了新的契机。因此,公安人员在今后的工作中,要转变传统的情报思维方式,树立大数据工作意识。首先,要注重培养“样本≠总体”的意识。传统的随机抽样会因为样本选取的多少而影响最终结果的精确性,而大数据时代的到来使得数据的整体分析成为可能。其次,要注重培养“相关关系”的意识。通过相关关系的分析可能使两者看似无关的信息之间确立相关关系。因此,要摒弃对于因果关系的偏执,培养相关关系的意识。最后,要注重培养评估反馈意识。大数据分析工具的算法和模型都是人工搭建的,情报预测失准不可避免。因此,要培养评估反馈意识,根据实时预测结果不断矫正系统,以实现精确预警。

(二)完善大数据警务平台。以大数据为依托构建的警务平台,需要不断更新完善来适应社会治安形势的变化。一方面,要确保数据来源速度快、范围广。这就要求情报收集人员在收集数据时,尽可能地将更多的社会数据、网络数据囊括进来,并实现数据的实时传输和实时分析,确保情报产品的及时性。另一方面,基于大数据的警务平台要破除信息壁垒,实现不同部门、区域之间的情报信息的无障碍共享,以应对新形势下情报主导警务的需求。

(三)培养大数据应用人才。一是要培养一批大数据应用方面的公安人才。这些人既能准确收集所需要的数据,又能在情报产品输出后给予正确的评估反馈。同时,这些人还要负责预警后的处理工作,确保预警信息及时传送到相关部门。二是要培养一批大数据方面的技术人才。这些人在熟悉公安业务的同时,还要有统计学、高等数学、计算机科学等方面的相关背景,除了构建大数据警务平台外,还要负责平台的日常维护和安全保障。

(四)规范大数据使用方式。随着大数据技术的运用,公民越来越多的个人数据被采集,而相关的法律法规却还是一片空白。对此,公安人员在运用大数据实现情报预警的同时,需要逐步规范使用方式。首先,情报的检索和查阅需要按照级别来分类,只有达到一定级别的公安人员才有权限查看。对于一些涉及公民个人隐私和国家安全的数据,更要注重数据的安全保护。其次,在数据收集的过程中,对于法律未规定而又涉及个人隐私的数据,要及时向上级领导报告,在获得批准后才能录入系统进行联机分析。最后,系统输出的情报预警信息也要加密处理,防止情报预警信息泄露或者被不法分子窃取利用。

[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,(1):146-169.

[2]杰瑞·莱特克里菲[英].情报主导警务[M].崔嵩译.北京:中国人民公安大学出版社,2010:74-77.

猜你喜欢

警务情报预警
情报
情报
情报
法国发布高温预警 严阵以待备战“史上最热周”
环球警务专访
浅谈港航公安网上警务公开的现状和问题
警务训练中腹痛的成因及预防
机载预警雷达对IFF 的干扰分析
交接情报
警务指挥与战术研究现状及发展趋势