APP下载

大数据时代、相关关系及情报意识*

2016-03-14朱丽洁

甘肃科技 2016年22期
关键词:情报意识时代

朱丽洁,韩 兵

(1.甘肃省社会科学院信息网络数据中心,甘肃 兰州 730070;2.江苏省社会科学院图书馆,江苏 南京 210013)

大数据时代、相关关系及情报意识*

朱丽洁1,韩 兵2

(1.甘肃省社会科学院信息网络数据中心,甘肃 兰州 730070;2.江苏省社会科学院图书馆,江苏 南京 210013)

“大数据”是大量的相关信息被用以分析、预测的概念。基于相关关系分析的大数据体现为一个情报过程。掌握大数据需要具备自觉的、敏锐的情报意识。

大数据时代;相关关系;情报意识

人们曾经为“信息爆炸”而迷惘,如今却在千方百计地从“大数据”中寻求机遇。据称,在这个所谓“大数据时代”,两年当中所产生的数据可以占到了人类文明所获得的全部数据的90%。而到2020年,全世界产生的数据规模又将达到今天的44倍[1]。这种铺天盖地与日俱增的海量数据带给人们的不再是迷惘,而是宝贵的资源、机遇和财富,因为人们已经拥有了破解大数据之谜的法宝——云计算、分布式处理以及相应的存储、感知技术,从而能够发现、掌握这些非结构、半结构化并且难以收集和利用的数据中所潜藏的意义。于是,大数据的拥趸们欢呼:“一切惯有思维和解决问题的方式在大数据时代即将发生颠覆性的改变”[2]。

大数据真的具有如此法力,以致我们只要祭出云计算之类的“法宝”就万事不难?就不再需要惯有的思维和方法?如此,我们今后所要做的就是数据的收集、积累和存储,以待分析。需要什么就能够从这个宝库里掏出什么来。

1 大数据之“大”

信息是事务属性的外化,它示以我们属性的特质和表征,助我们判别“是什么”;至于“数据”,通常是指那些被用以分析的信息,我们可以从这样的分析中预知事物的未来或未知,即“会怎样”,进而做出自身行为的选择和决断。因此,“大数据”应该就是“大信息”(完整的、原发的信息)被用以分析、预测的概念。而当信息中所蕴含的能预示“会怎样”的意义经过分析而被发现,并且被接受,便成为情报,具备了或则产生了影响人们思想和行为的“大”效应。这样的认识基本涵盖大数据的5V特点——Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。大信息之变身为大数据,这是时代的进步,说明人们有了对散在的、漫无边际的、与日俱增的信息加以识别、区分、整合、利用的情报意识和能力,而不再是一味苦叹信息的冗余和污染。

大数据在本质上仍然是信息,是有着内在关联的完整(全部)信息,虽然很多时候看上去风马牛不相及。大数据的源源增长实际上是在反映事物内在关联的源源不断发生。随着数据仓库、数据挖掘乃至基于数理分析原理的大数据分析等信息处理技术的发展与运用,这些反映着事物内在关联的大量度的数据得以大广度、大深度的分析处理,进而从中挖掘出影响人们思维决断和行为取向的大效应。这或许就是大数据之“大”的含义吧。权威的Gartner(高德纳)IT研究与顾问咨询公司曾断言:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产[3]。其中就涵盖了大数据之“大”的这三种含义,还有它的信息属性。

2 大数据的情报性

“大数据时代”就是依据大数据分析作出认知、判断、选择的时代。麦肯锡管理咨询公司声言:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”美国《纽约时报》等媒体这些年也连篇累牍的载文渲染“大数据”时代的降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉[4]。

《大数据时代》一书的作者维克托·迈尔·舍恩伯格和肯尼斯·库克耶被誉为 “大数据时代的预言家”,因为正是他们指出了大数据的意义就是预测,将为人类的生活创造前所未有的可量化的维度;而大数据时代最大的转变就是放弃对因果关系的渴求,取而代之关注相关关系。也就是说只在乎“是什么”,而不问“为什么”。何谓“相关关系”?该书解释说:“相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加[5]。”这就是以数理关系这种表象来揭示客观现象或事物之间所发生的互相依存相互作用的因果关系,只是我们只须看重这种“依存”、“作用”的结果而不必管其因果。在逻辑学中,相关关系早有阐述并且分门别类,如联想关系、类缘关系、非等级关系等诸种不同类型的相关。这些不同类型的相关关系都是破解大数据之谜的密钥。

置身于大变革的时代,我们或许会迷惘,但不应该迷信。基于数据分析的决策当然比只靠经验和直觉要真实得多也高明得多,但前提必须是数据的完整、准确和具有相关性。所以,信息要变身为数据必须预先经过人的类性识别与范围选择;再者,人类的“思维和解决问题的方式”从未仅限于预测,更不可能被预测所替代,那样人类岂不是又回到了占卜时代?基于大数据的占卜而不再是龟壳或牛骨头罢了。再进一步说,“相关关系”的思维路径也非大数据时代的新发明,由此及彼、由表及里,不是自古已然的“相关”思维范式?而情报学更是专门研究“相关关系”的学问——从事物显在的、潜藏的相互关系中寻出蛛丝马迹,发现情报价值,进而为判断、决策以及科学研究提供依据或佐证。大数据时代不过是人类开始正视呈几何数增长的大量信息,开始自觉的发现其中所蕴含的意义和价值,进而加以有效开发和利用。“大数据”让人类社会活动所衍生出的、自然界自然而生的大批量信息变成了资源、“生产因素”,这在情报学看来就是一个从信息中发现意义、挖掘价值的情报过程。因此,置身于大数据时代,我们自身所要做好的准备就是提升、强化能够应对大数据特性的情报意识,具备更自觉、更敏锐、更快捷地发现那些过去熟视无睹视而不见的种种“相关”的能力,从而积极、主动、灵感地从大数据中探寻能够弥补我们的知识缺失和思想不确定的情报价值。

3 掌握大数据的情报意识

信息爆炸让我们“迷惘”,正是缘于我们缺乏从大量信息中寻求关联、析出情报的自觉意识;面对大数据我们又往往显得“迷信”,那是因为我们有些唯大数据分析技术是瞻,唯“大数据预测”是信,而放弃了人类主观意识的能动性。

情报意识看似一种对于“相关关系”的敏感、悟性,以及追根索据刨根问底的习性,其实是知识、经验、阅历的累积而练就的一种思想素质。一个具备相应知识背景的人,才可能对外在的相关信息作出反应,感悟到其中蕴含的意义和价值,否则便会对牛弹琴无动于衷。由此不禁让人想到上世纪的哲学科学家夏佩尔曾提出过的“信息域”概念。在他看来,科学活动由两个部分构成:待研究的信息群,即研究对象;背景信息群,即研究所赖以的现有知识。由背景信息群启示、引领而逐步发现、确定并组织起一系列相互关联的研究项就构成了科学研究的“信息域”。夏佩尔的信息域和基于“相关关系”的大数据其实是异曲同工:“一系列信息项聚合起来形成了一个具有如下特征的信息域:①这种信息项的集结依据各个信息项之间的某种内在联系;②如此集结的‘信息域’蕴含着某些令人深思的问题;③这些问题是很重要的;④当前的科学技术水平已经为这些问题的解决做好了‘准备’[6]”。可见构成科学研究的“信息域”和构成“大数据”的原理是一致的,都

是一个主、客观知识相互作用的结果。大概不会有谁真的随意拿一个人的鞋码来预测他的爱情,因为预测所采用的数据类型都是要经过选择的,就是经过人的意识判别过的。或则可以说,大数据之所以有意义就在于其中隐含着关系某一事物的信息域,打开它就能够告诉我们一点什么。无论我们是在做科学研究或是经营决策,对于相关事物或问题所关联的各种各样层出不穷的海量信息首先应当作出情报意识的领悟与判断,识别出哪些类型的信息是“令人深思的”,是不可或缺的,而哪些又是不靠谱的,应当舍弃。作为主体的人,我们必须具备对信息域存在的主观意识和对信息间相关关系加以分析推断的情报能力,能够在背景知识和经验积累基础之上,经信息的提示、引导而发生联想、假定意念,进而探求信息间隐藏着的内在联系,发现其间所蕴含的“重要问题”,使一些表面看来毫不相干无关紧要的信息不被忽略,而不相干的信息得以及时排除,如此,大数据分析的结果才能更加趋于严谨、准确而不至因某些变量的缺失或干扰产生谬误。众所周知,Google的流感趋势即时预测曾经是“大数据应用的典范”。自2008年起他们把流感患者在搜索引擎上留下的大量关于自身病情、所花费的时间、接受的治疗以及各种想法、需求、忧虑等信息变成了流感疫情整体性趋势的信号加以分析,做到了比美国疾病预防控制中心提前两周发布监测数据。而至2013年,他们的预测偏差竟高达140%,成了“大数据缺陷的典范”。造成失误逐年增大的主要原因之一就是数据出现了“过度拟合”:很多关键词看似与流感有关而其实无关[7]。由此可见,人在大数据面前是应该有为的,是必须带着自己的主观意志而作为的,而不是听任“大数据”说风是风说雨是雨。

日本东京创造社创始人山上定也曾经说过:“假如不以那种主观意识阅读报纸,必然会漏掉许多重要的信息。所谓‘那种主观意识’就是‘应该这样’,‘大概会这样吧’等假设”[8]。正是这种“主观意识”和“假设”,在看似风马牛的事务中发现了信息域的某些“项”,发现了各种变量之间的关联,也分辨出了无关。一个人的鞋码和他的爱情也许扯不上关系,但是谁能否定,一条人口流离的记载或许暗示着政治动荡、战乱或自然灾害的历史背景;古老的风俗民情不但是传统文化的印迹,也可能体现着某种生产方式下的经济特征;甚至语音的变化也不仅仅对语言学家有意义,同时也显示着人口迁徙、文化流向及经济交流的烙印。

不识庐山真面目,只缘身在此山中。“大数据”让我们能够从信息爆炸的迷雾中找到一线光亮,见着一片蓝天。但这一线光亮能否洞穿我们的迷惑?我们所得到的是否就是自己的那片蓝天?要成为大数据的真正主人,我们就必须抱定“那种主观意识”——主观上的情报意识。否则,我们将依旧是迷惘,或则迷信。

[1] 曾建勋.大数据时代的情报学变革[J].情报学报,2015,1.

[2] 郑渝川.大数据时代意味着什么?[J].中外管理,2013,3.

[3] 百度百科:大数据.[EB/OL].[2013-06-10].http://baike. baidu.com/view/6954399.htm

[4] 庄春晖.“大数据”时代来临决策不能只凭经验 .[EB/OL].[2013-07-12]http://www.dfdaily.com/html/113/2012/4/11/ 774524.shtml

[5] 维克托·迈尔·舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[6] 夏佩尔.理由与求知[M].褚平,周文彰,译.上海:上海译文出版社,2001:306.

[7] 壳社.大数据的傲慢:我们能从谷歌流感趋势预测的失败中学到什么?[2015-10-21][微信号:iBio4P].http:// www.bio4p.com/depth/9683.html

[8] 山上定也.惊人的信息推理术[M].温元凯,译.上海:上海文化出版社,1987:3.

G350

甘肃省哲学社会科学规划项目(项目号:14YB124)。

猜你喜欢

情报意识时代
情报
情报
人的意识可以“上传”吗?
情报
增强“四个意识”发挥“四大作用”
意识不会死
强化五个意识 坚持五个履职
e时代
e时代
e时代