APP下载

数据新闻实践中的法律问题分析

2017-05-13许向东

新闻爱好者 2017年4期
关键词:数据新闻数据采集隐私权

许向东

【摘要】大数据作为一种重要的资源,在为我们的工作、生活带来便利的同时,也会因采集、使用和存储不当,危及国家安全或个人隐私,因此,将数据新闻的生产实践纳入法制轨道,促使其良性发展,有着深远的意义。

【关键词】数据新闻;数据采集;隐私权

一、当前数据采集的主要特征

(一)采集领域日渐广泛

目前看,大规模收集数据信息的主要是政府部门、涉及公共服务的企业和营利企业(包括互联网行业)。政府部门为了公共管理和公共服务,在人口普查、户籍、税收等领域大规模收集有关公民的各类数据。医疗、教育、银行、保险等行业机构、商业企业通过病人、储户、消费者所提供的个人信息,不断收集、存储大量公众数据。互联网行业也通过网络用户注册的方式,实现对用户信息的收集和存储。

(二)采集方式更为隐蔽

在采用纸质方式收集数据信息的时候,通常情况下,被采访者会被告知是哪个机构在采集信息,采集的是哪些方面的信息,将被用于何种目的等,具有明显的公开性。如今,传统的数据收集方式被互联网技术所取代,公众在网上购物、搜索或者使用某个程序时,在不知不觉中就被网络公司拿走了与个人生活相关的一些数据。仅有一些正规的运营商,在公众(用户)使用应用程序时,会以适当的方式提醒用户注意个人数据的安全,并给予保证。

(三)采集范围不断扩展

个人信息的传统收集内容相对简单,仅是姓名、性别、年龄、籍贯、民族等基本资料,其作用是身份的识别。随着通信技术、互联网技术的发展,对公众(用户)数据的收集变得事无巨细了。特别是各行业实名制的推行,使得我们生活中的一言一行、点滴小事都被记录下来。原本被收集的基本信息逐渐扩展到更多的甚至涉及私密的数据都被动态跟踪和记录。如央视做过的《据说春运》中就是借助了对手机用户手机定位数据的分析,美国的《谷歌流感预测》也是基于对搜索引擎中检索流感关键词的IP地址等的分析。

二、公民個人数据所面临的危险

新闻报道是关于人的活动的信息传播,新闻事件的主体是一个个鲜活的人,关于人的数据是数据新闻实践的基本要素。在数据的采集和处理中,公民个人将面临两种潜在的危险。

(一)公民个人数据的非法收集

采集足够的数据是进行大数据分析、挖掘的前提。非法收集指的是在被收集人未被告知的情况下,被强制收集或暗中收集了属于公民个人的信息,如果将个人数据的法律属性界定为人格权的话,上述行为就侵害了公民个人的人格权。公民个人除享有名誉权、肖像权、隐私权等既存的人格权外,还有信息自决权,即公民个人依据法律,控制自己的个人信息并决定是否被他人收集和利用的权利。有关法规规定:“个人有权了解谁在搜集其信息资料,搜集了怎样的信息资料,搜集这些信息资料用于何种用途,所搜集的信息资料是否客观全面,个人对信息资料是否有自我利用或允许他人利用的权利等。”[1]现如今,社交媒体、电子商务、云计算及互联网的快速发展,为大数据行业机构快速“捕捉”数据提供了便利,为了避免因数据的非法收集和使用给公民个人带来损害,数据采集者应在被采集者知情同意的前提下方可收集公民的个人数据。

(二)公民个人数据的过度分析

大数据技术使采集和存储数据信息成本降低,更重要的是,通过对原始数据的分析挖掘就可以推导出过去、预测出将来的相关信息。比如,通过对转账的时间、数额、对象等信息进行数据分析,可以“洞察”其经济状况和社会交往范围等。大数据分析的结果有时会出乎意料,超出了数据被采集者的告知范围。但这不能成为对公民个人数据过度分析的借口。众所周知,孤立地看一组数据、一个案例没有价值,但如果把若干组数据、若干个案例关联起来,找出其中的相关性和因果关系,则会使秘密暴露无遗。一方面,人们在社交媒体上生产着无法计量的数据;另一方面,各社交网站则不同程度地开放用户所产生的实时数据,这些数据如果被个别数据分析机构所收集,并通过和智能手机中的定位信息、网络购物等多种数据相组合,则可以精确地把握公民的个人情况。采用大数据技术对原始数据进行运算、挖掘之后获得的公民个人数据属于延展性产品,但是,这类数据的指向性更明确、价值更大,理应和原始数据一样得到法律的保护。对大数据的开发程度越深,大数据的实现价值越大,大数据使用者由此所获得的利益也就越大。因此,只有规范大数据分析的行为和尺度,才能有针对性地消除对公众个人数据的滥用。

三、媒体在数据采集环节面临的法律问题

对新闻传媒而言,采集数据的方式主要有两种,即主动采集原始数据和从其他机构获得数据(无偿使用,有偿转让)。由于大数据的采集可能涉及公共安全、商业秘密、知识产权、公民的个人隐私等,因此,数据的采集行为需要遵循法律的规定。

(一)采集原始数据的合法性

媒体直接采集原始数据应注意两点:一是采集的主体要取得相关数据采集的资格。媒体是新闻信息的发布机构,为了生产新闻信息,获取某些领域、行业的一般性信息(对外公开不会影响其名誉或利益)无可厚非。但如果所要获取的数据有一定的特殊性,如涉密及涉及隐私、安全等,因数据公开可能给数据提供者带来负面影响,媒体将不得不考虑自身的社会属性和机构性质,衡量选题的适宜性。二是采集的行为要符合法律的规定和要求。新闻媒体应该明确告诉数据提供者自己的身份、数据收集的目的和用途,收集时不得采用欺诈、非法访问或其他非正常手段,并且对所收集的数据不得任意修改和歪曲,未经同意,不得改变数据的用途,不得擅自将数据公开或告知第三方。

(二)间接获取数据的法律规定

第一,媒体从其他机构获取、使用数据时需要有法律的保障。随着大数据产业的日益发展,数据的转让、购买成为普遍现象。媒体在以有偿、无偿的方式获取数据时,要明确数据提供者是否是依法获取的数据,而不是以不正当手段获得的、存在一定隐患的数据。同时还要了解数据提供方对数据的所有权情况,是否合法拥有并可以合法出让。为了避免因数据转让产生纠纷,媒体在数据交易中要签订数据转让合同,对数据的数量、使用范围、使用时间、使用方式等做出明确、具体的约定。第二,媒体获取公共数据需要法定授权。公共事务涉及国计民生而成为新闻报道中的重要选题。尽管社会公共领域所产生的数据在权属上具有公共性,但是,在我国现行制度下,拥有公共事务管理权的是各级行政部门,这些部门自然也被赋予了获取公共数据的专属权利。其他的社会组织机构只有获得法定授权方可采集公共数据。

如今,大数据的采集扩展到了各个领域,即使那些没有被授权的公司企业,也在广大公众不知情的情况下采集了大量关于个人生活的数据,并且用于分享、营利或其他公众所不知道的地方。法律是人们的行为规范,担负着维护社会良性运转的责任,因此,完善以大数据应用为内容的各项法规,也为数据新闻实践提供了保障。

四、数据新闻应对侵害隐私权的策略

2013年,中央电视台在“3·15晚会”节目上曝光了一些互联网企业非法窃取和利用Cookie,非法侵犯网民隐私权的事例(Cookie是由Web服务器保存在用户浏览器上的网络插件,它包含了网民上网、浏览所留下的痕迹信息),通过分析Cookie就可以了解一个素不相识的人,这一曝光引发了公众对网络使用中如何保护隐私权的关注与热议。

隐私权是指自然人享有的私人生活安宁与私人信息秘密依法受到保护,不被他人非法侵扰、知悉、收集、利用和公开的一种人格权,而且权利主体对他人在何种程度上可以介入自己的私生活,对自己是否向他人公开隐私以及公开的范围和程度等具有决定权。[2]“保护公众的隐私权”是新闻传播领域老生常谈的话题。尽管在平衡公众知情权和保护隐私权之间有一定的难度,但是,国内外的传媒行业在新闻采制中如何保护公众的隐私权已经做了不少的努力,包括制定相应的职业规范、行业条例等。

现如今,大量社交媒体如Facebook、Twitter以及国内的“今日头条”等都是利用大数据技术运行的,它们通过对用户的个人数据进行持续分析,来提升新闻信息推送的精准性和个性化的效率。人们在私人活动中产生的数据可以直接体现个人在做出选择时的偏好,有着较高的市场价值,自然也就被许多电商、数据挖掘公司所关注。但是,也不可否认这样的事实就是人们日益变得透明了,原本看似属于个人的私人空间也难免被他人“窥视”和“侵入”。

大数据技术引发了传媒行业格局的变动,传统新闻生产中形成的隐私保护体系开始松动,在新的传播技术和传播样式中求得隐私权与知情权的平衡,成为数据新闻生产不可回避的课题。大数据技术可以挖掘出数据背后的关联性,可以将个人的零散信息汇集成整体,实现对目标人群或个人行为、意愿的掌控。所以说,在大数据时代,数据为王,拥有了数据也就占据了行业制高点。但是,我们在利用大数据为人们提供生活便利的同时,也存在着个人隐私随时暴露在“第三只眼”之下的危险,因为有些数据被收集、挖掘后,个人却并不知道其用途。因此,“没有坏数据,只有对数据的不合理使用”[3]这句话还是有道理的。

数据新闻生产的前提就是尽可能地收集数据、挖掘数据,为了“投受众之所好”还要分析受众的阅读偏好数据,以及在传受互动中分享受众的个人数据,这都可能导致为了深挖数据而侵犯公众的隐私,特别是为了迎合个别受众而推送一些不宜传播的内容,如低俗信息等,这都将触碰社会道德和职业伦理的底线,并引发社会争议。那么,针对我国新闻传媒领域的具体情况,怎样才能找到平衡点,既能让大数据技术服务于新闻报道,挖掘出数据背后的新闻价值,又能很好地保护公众的隐私呢?本人觉得有三点值得考虑:

(一)从立法层面加强对公众的隐私保护

目前,全世界已有近20个国家制定了保护个人隐私的法律。2012年12月28日,第十一届全国人民代表大会常务委员会第三十次会议通过了《关于加强网络信息保护的决定》,要求网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息时,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式和范围,并经被收集者同意,不得违反法律、法规的规定和双方的约定收集、使用信息。[4]2013年2月,我国首个个人信息保护标准《信息安全技术公共及商用服务信息系统个人信息保护指南》(以下简称《指南》)正式实施,对大数据时代的个人数据信息管理进行了原则性的规定。该标准最显著的特点是规定个人敏感信息在收集和利用之前,必须首先获得个人信息主体明确授权。[5]在大数据时代,从法律角度考察公众的隐私权保护,关键问题在于三点:一是明确可抓取数据的范围和边界。抓取用户数据是网络服务商获取信息的前提和基础,2013年2月的《指南》将个人信息区分为一般信息和敏感信息,不同类型的信息要区别对待。尽管单纯的数据抓取并不会给用户造成实质性的损害,但是,公众允许个人数据被抓取并不等同于允许被使用。事实上,大多数公众还是同意以一部分个人数据(一般信息)换取优越的互联网体验的。二是给予公众对自身数据更多的主导权。在数据抓取阶段,要告知公众哪些数据被抓取、抓取方法以及使用于何处、使用目的;公众享有修改、编辑错误数据的权利;公众有权决定数据是否可以转售或提供给第三方等。三是明确在数据使用中侵犯隐私权的处罚。不要把隐私权的保护仅仅放在需要征得个人同意上,而是要明确,如果侵犯了个人隐私将会受到怎样的法律追究和处罚。也只有这样,数据采集者和使用者才会对涉及个人隐私的数据予以评价和研判,预估因不当采集或使用可能带来的各种风险,进而从源头上杜绝侵犯个人隐私的行为。

(二)从行业层面规范对个人数据的采集与使用

在大数据时代下,公众的个人信息一旦被以数据化形式储存,便掌握在政府部门、企业组织的数据库中,公众个人反而很难进行自我保护。尽管立法部门将大数据技术上升到法律层面进行界定,并规范了数据的使用,但是,并没有专门的法律法规针对数据分析公司的工作内容、工作职责等进行明确,对于这一行业,需要有专门的行业准则来进行规范。目前,我国互联网行业制定的《中国互联网行业自律公约》(2004年)要求互联网企业保守用户信息秘密,不利用用户提供的信息从事任何与向用户做出的承诺无关的活动。《中国电子商务诚信联盟公约》(2005年)也提出了加强消费者隐私权管理,确保消费者各种信息和资料得到安全保护。许多互联网企业在消费者使用服务时都提出了隐私声明,但这些声明大多属于免责声明,不能有效地保护消费者的隐私,导致这两部公约缺乏具体的操作性,难以落实对网民隐私保护的承诺。因此,加强行业自律,制定相应的行业标准、奖惩机制,比空洞的规约要来得有实效。2012年11月,百度、腾讯、网易、新浪等12家互联网企业在北京签署了《互联网搜索引擎服务自律公约》,该公约第10条规定:搜索引擎服务提供者有义务协助保护用户隐私和个人信息安全,收到权利人符合法律规定的通知后,应及时删除、断开侵权内容链接。《中国新闻工作职业道德准则》也规定新闻工作者要通过合法和正当的手段获取新闻,尊重被采访者的声明和正当要求。“合法和正当的手段”就是要尊重他人的隐私,使之不要受到侵犯和非法使用。大数据的应用主体包括数据来源型主体和数据分析型主体。签署公约的12家互联网企业都属于数据来源型主体,而对数据分析型主体则没有涉及。另外,我国缺乏对行业自律的监管机构,无法真正监督自律组织成员对行业自律规范的执行情况。在数据新闻生产中,数据是基础资源,比較容易涉及隐私保护问题。在收集个人数据时,要区分一般信息和敏感信息,注意保护个人的敏感信息。在使用数据时,要合理地利用数据,处理好个人隐私权和公众知情权之间的关系。尤其是媒体建立的受众数据库中的信息,这些数据关联着受众消费行为的偏好、习惯和特点,一定要把握好使用的范围和程度,以不侵犯他人隐私权为尺度。

(三)从技术层面消除侵犯隐私权的隐患

人们常说,在Web1.0时代,“没有人知道你是一条狗”;在Web2.0时代,“人人都知道你是一条狗”;而在大数据时代,“你就是一条透明的狗”。正如美国专栏作家帕特里克·塔克尔所描述的:正当我们急急忙忙地在周围环境中铺设一层数据收集设备的同时,我们或许忽视了一个事实,我们用来监测周围环境的这款设备,也会轻易地出卖我们。我们会被监视、会被跟踪。一切正在发生。[6]

在国外,有不少企业将个人数据隐私保护视作商机,推出各种产品和服务,协助人们保护隐私。一种类型是开发个人数据保护的软件产品,协助加密、反追踪或者销毁个人数据;另一种是开发无数据搜集功能的产品,使用户放心使用。反追踪产品中有代表性的是Do〓Not〓Track(Dnt)。这是针对在线广告公司等网上的跟踪行为,向消费者提供的一种能够简单谢绝跟踪的手段。此外,Disconnect.me也是一款具备隐私保护特点的软件。它是一款隐藏网上身份的浏览器扩展工具。Disconnect.me可以让你监控和阻止网站搜集你的数据,目前可以监控超过2000个网站。一旦发现网站试图获取你的数据,它将把数据进行加密处理。在搜索引擎方面,DuckDuckGo近来异军突起。与一般搜索引擎不同的是,DuckDuckGo并不会对用户行为进行追踪,而是采取新的技术来提升其搜索质量,主张维护使用者的隐私权,并承诺不监控、不记录使用者的搜索内容。[7]也就是说,DuckDuckGo不收集和保存使用者的识别数据,不保存或者分享使用者所搜索的信息。

在互联网时代,受众在海量信息中寻找到所需要的内容,不得不耗费一定的时间和精力。而数据新闻及其衍生产品,包括因报道需要而构建的数据库,则为受众获取信息提供了便利,因此,新闻从业者为之所付出的劳动创造理应从法律层面得到保护。法律作为人们行为的规范,在平衡新闻传媒与社会其他利益关系的同时,也赋予新闻传媒以良心、责任等价值追求。

(本文为国家社科基金项目“我国数据新闻的理念、实践及其人才培养模式研究”的阶段性成果之一,项目批准号:16BXW018)

参考文献:

[1]王利明.“个人信息资料权”是一项独立权利[N].北京日报,2012-07-09.

[2]陈绚.大众传播法规案例教程[M].北京:中国人民大学出版社,2009:178.

[3]王芮.纽约时报:大数据时代的隐私问题[EB/OL].http://tech.qq.com/a/20130325/000084.htm.

[4]全国人大常委会关于加强网络信息保护的决定[N].南方日报,2012-12-29.

[5]张辛欣.我国首个个人信息保护国家标准2月1日起实施[EB/OL].新华网.2013-01-21.http://news.xinhuanet.com/politics/2013-01/21/c_

114444097.htm.

[6]帕特里克·塔克尔.赤裸裸的未来〓大数据时代:如何预见未来的生活和自己[M].南京:江苏凤凰文艺出版社,2014:20.

[7]王忠.大数据时代个人数据隐私规制[M].北京:社会科学文献出版社,2014:52-54.

(作者為中国人民大学新闻学院副教授,中国人民大学新闻与社会发展研究中心研究员)

编校:郑 艳

猜你喜欢

数据新闻数据采集隐私权
纳税人隐私权的确立、限制与保护
妈妈,请把隐私权还给我
谷歌尊重雕像“隐私权”的启示
中外数据新闻编辑流程比较研究
基于开源系统的综合业务数据采集系统的开发研究
大数据时代新闻的新变化探究
媒介融合时代数据新闻可视化教学探索
从“数据新闻”看当前互联网新闻信息传播生态
论患者隐私权保护