APP下载

数据产权界定:多维视角与体系建构

2019-09-12朱宝丽

法学论坛 2019年5期
关键词:产权用户

朱宝丽

(山东建筑大学 法学院,山东济南 250014)

数据应用和开发离不开数据产权的界定和保护。只有从理论上解决数据的法律属性、产权归属等基本问题,才能厘清数据各方的权利义务关系,推动数据使用和保护。从研究现状来看,数据能否以及作为何种法律客体仍存在争议,不同类别的数据产权归属认识上还很模糊。因此,有必要明确数据法律性质,界定各类数据产权,构建数据权利体系,从而推动数据开放和数据产业的健康发展。

一、数据的二维剖释与多元分类

(一)数据与信息:相关而又差异

根据现代汉语词典的定义,数据是指科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等活动的数值。从计算机术语看,数据是指表示客观事物未经加工的原始素材,可以是符号、文字、数字、语音、图像、视频等。

现行部分法律引入了“数据”概念。《合同法》和《电子签名法》均使用了“数据电文”的概念。新近修订的刑事、民事和行政诉讼法,均采用了“电子数据”概念,其中《最高人民法院关于适用〈中华人民共和国民事诉讼法〉的解释》中,明确将“电子数据”定义为“通过电子邮件、电子数据交换、网上聊天记录、博客、微博客、手机短信、电子签名、域名等形成或者存储在电子介质中的信息”,并且“存储在电子介质中的录音资料和影像资料,适用电子数据的规定”。(1)参见《最高人民法院关于适用〈中华人民共和国民事诉讼法〉的解释》第116条第2、3款。从内容分析来看,我国法律对数据的定义突出技术特性,国外对数据的定义虽有差异,但大都指向结构化信息(数据)。作为结构化信息的对应概念,非结构化信息一般指“内容”,如新闻稿和情况简报等,当其“内容”被转换为“结构化形式”,则称为“数据” 。(2)参见OMB Memorandum M-13-13(May9,2013),Open Data Policy-Managing Information asan Asset,available at https://www.whitehouse.gov/sites/default/files/omb/memoranda/2013/m-13-13.pdf(accessed Mar.20,2015).

从内涵上分析,数据和信息之间存在包含关系,数据是行为主体初始各类活动的原始客观记录,含义并不明确,而信息则是运用技术手段加工、整合、解读后的有确切意义的数据。(3)参见郑磊:《开放政府数据研究:概念辨析、关键因素及其互动关系》,载《中国行政管理》2015年第11期。两者关系如下:(1)信息是加工后的数据。信息是一种经过选摘、分析、综合的数据产品。(2)数据和信息对不同主体价值不同。一些数据对某些人来说是信息,而对其他人只是数据。(3)信息是观念上的。信息是加工了的数据,采用何种模型、何时加工数据获取信息,可以人为决定。

(二)数据生成渠道及类别

1.从数据来源或制作主体来分,分为公共数据、科学数据、商业数据和个人数据。(1)公共数据。这类数据绝大部分是政府履职获取和保留的,涵盖自然知识、现代知识产权、经济和社会发展数据,涉及GDP、金融、气象、水文、医疗、教育等信息数据。(2)科学数据。主要指一些科研院所等自主从事科学理论研究、实验、技术开发等所形成的各类数据。(3)商业数据。商业数据主要包括企业在运营中积累的数据,以及以网络平台等为载体获取的数据。(4)个人数据。涵盖个人身份、社交等数据。

2.根据数据表现方式不同,分为标准化数据与非标准化数据。标准化数据表现为具体数值的信息,如经济增长率、经营收入等,可以是直观的数值,也可以是图表。非标准化数据主要基于数据格式差异,如微信、微博、QQ等社交媒体上的文本、图片、音视频、通话录音、交易记录等。

3.从数据产生和利用的层面,分为个体数据与整体数据。个体数据是自然人、法人及其他组织基于个体生产生活而产生的数据,如市场交易情况,网络消费记录,社交网络的音视频等。其中个人数据是最重要的组成部分,涵盖四类信息:(1)身份信息,如性别、籍贯等。(2)私人空间数据,如朋友圈、学历背景等。(3)隐私性信息,如身体疾患、居所、日记等。(4)上网产生的有关信息。整体数据是上述大量个体数据的聚合,在大数据的语境里,是指所有个体数据组成的存放于网络服务器的数据集合。

二、数据产权争议及确权依据

(一)多维视角和立场下的产权归属之争

数据产权归属是数据产业发展需要解决的基本问题,它决定着如何在不同主体间分配数据价值、义务和责任。“正义的财产权制度,应当对财产权法律关系中的权利、义务作出合理的分配,并尽可能地平衡社会生活利益间的冲突。”(4)John Rawls, A Theory of Justice,Harvard University Press,1999,p.5.目前我国尚无法律对数据归属问题作出明确规定,但在个人信息数据的收集、使用方面已有一些规范。全国人大常委会《关于加强网络信息保护的决定》和工信部《电信和互联网用户个人信息保护规定》均规定了个人信息收集方式和基本原则。刑法修正案(七)和(九)规定了关于个人信息方面的犯罪及刑罚。2015年4月,贵阳成立了大数据交易所,规定了“数据买卖双方要保证数据所有权、合法、可信、不被滥用”的原则,其后不久完成11笔交易。(5)参见王利明、杨立新、王轶等:《民法学》(第4版),法律出版社2015年版,第97页。2014年6月,中关村大数据平台发布了中国第一个行业规范《中关村树海大数据交易平台规则》(6)中关村大数据交易平台:《中关村数海大数据交易平台规则》,http://www.shuhaidata.com/doc/.,其中关于交易数据范围规定极其广泛,包括个人、企事业单位、社会团体等,但该规则对于数据权属规定并不清晰。

在理论界,对于数据所有权归属尚未达成广泛共识。实践中,单个主体控制的各类数据,如自然人的姓名、性别、民族、住址等,法人机构的住址、经营信息等,产权问题较少争议。但对于涉及多主体数据的产权归属,分歧较大,争议主要集中在互联网企业以及其他需要大量采集个人数据的行业中。

第一种观点认为,各类数据基于数据主体的行为产生,没有主体数据就无价值,由此数据自然归数据产生者所有。有人建议应对用户数据设立财产权利,强调对数据享有优先权,并制约交易使用等行为,否则交易行为产生的数据过度商品化现象会侵犯个人隐私权,带来信息安全问题。在中国网络技术(Cookie)第一案(7)参见胡凌:《朱烨案界定网络隐私》,载《财新周刊》,2015年6月24日。的讨论中,有人提出法律应认可个人对数据的财产权,并制约网络公司的行为。

第二种观点主要来自产业界。很多作为数据控制者、处理者的互联网企业认为,如果用户数据没有被采集,不以数字化的形式存在,根本就不存在数据权利一说,用户使用平台服务所产生的数据属于企业所有。有些公司则认为自行投入巨大成本从各类渠道采集和管理数据,按照“谁投资谁所有”的原则,其合法权利应当得到法律认可,这些数据产权应归公司。

显然,上述观点有着不同的价值取向,第一种充分考虑个人隐私保护,以用户尤其是自然人为优先项,对数据交易予以限制;第二种则从促进数据流通角度出发,赋予企业对收集数据的产权,有利于数据交易和数据产业发展。此外,最具有争议性的是基于用户的原始数据,进行清洗脱敏后的产权归属问题,如何划分数据主体、控制者、使用者的产权边界,各方莫衷一是。

(二)数据确权的依据

大数据时代,数据流通链条向纵深延长,诸多主体为数据资产化均做出了不同程度的贡献,数据价值不断释放,原始数据的作用渐趋弱化和边缘化,更多的是数据聚合和挖掘后衍生的价值。一组有价值的数据,涉及到数据创造者、控制者、处理者、使用者,各主体身份在数据流转中存在交叉和转换,由此产权界定也相对复杂。因此,需要综合考虑,依据科学的原则和标准来界定产权。

依据物权法基本原理,产权取得分为原始取得、继受取得。前者主要有以下形式:先占、发现埋藏物、拾得遗失物、添附、善意取得。继受取得是指通过法律行为或法律事件,从原所有人取得所有权,包括因买卖、赠与、互易、继承遗产、受遗赠等取得产权。原始取得,是指所有人最初地、不依靠他人的所有权的存在而取得所有权。以自然人为例,自然人因为自己的行为而产生了一系列数据,并不依靠他人帮助,这种数据取得属于原始取得,理所当然归个人所有。其他原始获得产权方式上,添附理论可以适用于数据交易领域。从数据交易来看,当数据主体产生基础数据以后,获得基础数据的主体通过对数据的混合、加工等,做成新的产品,使得数据得到增值,正好符合民法上添附的理论,下文将详述之。

三、显名(8)以数据内容是否具有识别性为标准,可将数据分为显名数据和匿名数据。显名数据,是指单独或与其他信息结合能够识别出特定个体身份的数据。本文作此划分的目的在于区分数据保护程度和保护方式,便于对不同形态的数据产权进行分析论证。数据产权:私有、公有与共有

(一)单体或多边交易形成的数据原则上属于私有

在众多对财产权的研究中,洛克的观点很有代表性,他阐述了私有财产神圣不可侵犯原则,(9)参见霍毅斌:《财产权:自然权利中的核心因素》,载《经济理论问题》2007年第12期。认为每一个人对自己的人身都享有所有权,每一个人对自己的生命、自由、财产都具有平等的权利,任何他人都没有占有权。(10)参见[英]洛克:《政府论(下篇)》,叶启芳、瞿菊农译,商务印书馆1964年版,第86页。由此推之,自然人基于自己行为产生的各种信息并因此而形成的数据,自然专属于个人,尤其是数据产品,属于劳动付出所得,理应享有产权。因此,自然人或企业自身参与社会活动的显名或可识别数据,可以隐私、商业秘密或知识产权形式存在,产权归属于数据产生者自己。

双边或多边交易中产生的数据,关涉到参与各方,产权原则上共有。现实中,通过契约方式来解决多边交易数据归属问题不失为一个好途径。当各方主体因开展业务往来时,可以在合作之初进行约定,对于合作过程中产生的交易记录等原始数据或者基于共同开发某些数据项目而产生的衍生数据进行事前界定,明确数据归一方所有、双方共有,或者作出永不转让交易承诺,或者合作终止删除数据等。

(二)政府数据产权应属于公有

大数据时代,政府控制着大部分公共数据资源,从经济学角度来看,政府数据(11)政府数据是指政府及其职能部门以及依法行使行政职权的组织在其管理或提供公共服务过程中制作、获得或拥有的数据。本文仅论及政府掌控的数据,其他公共组织掌握的数据确权原理大致相同。属于公共产品。理由如下:第一,政府数据具有非排他性,平等对待所有主体、无条件且非歧视,不同于私人数据产品“谁付款、谁受益”,任何人对政府数据的消费不会影响其他人。第二,政府数据具有非竞争性,突出表现在政府数据边际生产成本和拥挤成本为零,理论上不论增加多少需求,同一数据集可以无限次近乎零成本的被重复访问下载。第三,政府数据效用不可被分割,无论政府数据如何被使用,都不会改变原始存储在开放平台上的数据效用,数据源不会被随意修改,用户对数据后续具体使用处理也不影响原数据的整体效用。第四,政府数据的公共性源于政府本身的公共属性。政府为履职而做出的各种数据行为是政府代表和增进公共利益的表现形式和必要途径,最直接结果就是产生各种公文记录或档案信息,比如规划、统计数据等;或者制定法律政策等通过各种数据信息传递来加强对社会的管理与服务。

从政府数据产生和来源来看,既有政府自身履职产生的信息,也有依法从外部获取的各种数据信息。政府部门均是在公共财政的支持下履职,获得的数据产权属于全社会,即全体公民公有,理论上应该开放数据,让数据回归社会,创造公共价值。从经济学角度而言,政府数据的最终价值是无法预测的,不同类别、不同规模和不同形式的数据组合,采用不同的算法、模型,往往会得出不同的结果。数据最终价值始终处于波动之中,但这种波动是由市场所决定,相对于原始数据,政府数据的利用在经济上属于增值过程,发挥着正外部性。因此,政府数据开放与共享可以考虑以数据池的模式来实现最大效用,但必须要明确各类政府数据产权。(1)自然知识数据。人类对自然和宇宙的认知数据,大多数都是政府依托公共财政,资助有关部门研究所得。对于这类数据,产权属于全社会,在非涉及国家安全的情况下,应该免费向社会公开共享。(2)历史遗产和现代知识产权数据。数字时代,关于历史遗产几乎都可以数据化,并在网络空间作为信息流和知识流传播。这类数据挖掘整理、标准化后,成为数字图书馆数据库的重要资源,产权仍然属于公有。此外,人们在社会生产和生活中,创造的一切知识形态的成果存放于数字图书馆,这些成果保护期满后,就成为人类共同财富,所有人均可免费使用。(3)经济社会数据。这部分数据是政府履职中掌握的数据,包括经济、治安、环境、交通等信息。同样在不涉及国家秘密时,免费向社会公众开放。(4)履职中获取的自然人和企事业单位数据。其中自然人数据,涵盖身份、信用、商事登记、判决等信息,企事业单位的经营或纳税记录数据等,原则上可识别的数据属于个人或企业所有,政府具有一定使用权和处置权,但是当事人有知情权、异议权或修改权。

上述领域的政府数据大多属于公有,但我们认为这种公有产权的行使上国家应该有特别的话语权。产权是个法律概念,划分产权是通过立法确定的。从国家产生的历史来看,正是国家的出现,才将人们的自然权利变为法律权利,没有政府组织或参与收集整理数据,何来个人数据的完整呈现?正是由于现代政府的出现,才使得个人数据成为法律的标的物。可以说,自然状态的产权具有不确定性,在数据产权创造中,政府是作出巨大贡献的,这才使得数据产权获得了法律上的确定性和外部的强制性公权保护。同时,在对个人数据的整理挖掘中,政府的劳动附加了数据的价值,大大增加了数据资产化、价值化的可能性。从某种意义上说,政府是数据财富的创造者和推动者,就如土地征用一样,没有规划前某地块价值很低,但当政府重新规划决定征用以后,被征用土地升值,这时候溢价收入是否应该全部归属于土地所有者(承包者)呢?有观点认为,正因为政府作出的规划行为才导致了土地价值增加,政府规划的作用应在土地溢价中得到体现,也就是说征地补偿费用要体现出政府规划变动带来的价值,不能无条件地满足被征用者过高的要求,否则意味着政府用公共财政去补贴少数人。因此,遵循上述思路,政府在数据确权上应该有特殊制度安排,由此才会有数据主权理论,即政府要在相当程度上监督数据私权利的行使。

(三)基于平台产生的商业数据归参与方共有

上述两类数据产权较容易界定,较难界定的是各类互联网平台掌握的涉及个体的交易或行为数据。这类数据产权界定甄别问题由来已久,早期的平台更多地体现实体特征,如商场、专业市场、交易所等,信息更多地以纸质形式存在。随着信息技术发展,很多信息变成了数据,数据很容易被存储、复制、加工,数据流转交易成为常态。平台的数据究竟归属谁?在产权界定研究思路上,传统法学通常遵循“事后研究”方法,依既定财产权类型和规范来解决纠纷,而法经济学则采用“事前研究”方法,假定纠纷发生后通过效率论证来重新确定各个权利束的顺位高下。在此,我们运用科斯定理来分析平台数据产权问题。科斯定理的主要内容是围绕交易费用为零或大于零两种假设而展开的经济分析。如果交易费用为零,无论产权如何分配都会优化资源配置、带来社会福利最大化的后果。然而,交易费用不可能为零,在大于零的世界里,数据产权归属方案在影响资源优化配置上就非常关键了。

1.数据产权配置给互联网平台用户。此时,用户对数据享有充分权利,有权决定平台是否可以使用个人数据,平台必须履行法律赋予的保护用户数据的义务。如果平台希望从海量的个人数据整理以及使用中获得收益,就必须向用户购买数据使用权,最终数据转让和资产化的收益由用户和平台共同分配。然而,数据使用需要平台与用户签订协议,征得对方在使用数据及相关细节方面的同意;用户同样要与平台进行事前谈判,对平台的数据使用行为开展监督,并对平台通过数据取得的收益进行计算,必要时寻求法律救济。这一过程会产生高昂的交易费用,因此用户实际分得的收益也较少。从操作来看,单个用户信息价值微乎其微,平台不会出价太高;对用户来说,出卖自己数据所得的收益简直不值一提,因此也不会投入太多关注。如果用户故意抬高自身数据的价格,总会有其他用户愿意以更低的价格出售数据,直至数据价格降为一分钱。用户当然可以在拒绝提供数据的同时,把数据以高于此平台出价的价格卖给其它企业,但这个过程同样也会产生交易费用。最终可能产生的结果是,由于预期交易费用较高,因此平台放弃了处理数据的权利,从而无法创造任何额外收益;而成千上万用户虽完全占有自身数据,却无法联合起来挖掘数据的价值,这会极大地制约大数据产业的发展。

2.数据产权配置给平台。在交易费用大于零时,产权的初始配置会对效率产生影响,因此应该把产权界定给能以较低交易费用取得价值的一方,即应将权利赋予“能够最具生产性地使用权利并且有激励他们这样使用的动力的人”(12)参见Ronald . Harry. Coase, The Institutional Structure of Production, Vol. 82(4) The American Economic Review (Sept.1992).,只考虑经济效率的话,产权界定给平台是最优的结果。平台为用户提供服务,用户购买产品或服务,双方各取所需,而交易数据只是这个过程留下的痕迹。因此,用户是否有权利索取从数据中获得收益的问题,实际是个如何分配正的外部性问题,或者说是应把数据能创造更多价值这一属性界定给谁的问题。在这部分数据产权界定给平台后,平台将拿走对这部分数据运用技术挖掘整合等带来的所有收益。此时,单个用户可以从平台手中买到自己的信息不被使用的权利,但这一过程发生的几率非常小,没有用户会主动要求买走交易数据信息,也没有积极性和能力去关注平台将数据商品化以后的多次交易,从而无法保护个人数据的安全。那么,用户联合起来是否能够解决这些问题呢?奥尔森在《集体行动的逻辑》中指出,当某一大型组织谋取群体利益时,个别成员的行动对整个集团利益影响可以忽略不计,个人认识到这一点往往倾向于“搭便车”。维护权利的行动往往需要许多用户联合实施,这要耗费大量的沟通、协调成本,很难维持;而且从行动中获取的收益不大,除少数热心的发起者外,其他人更愿意搭便车,导致集体维权行动陷入破产。平台往往在提供服务时,将使用公司服务和个人数据转让捆绑在一起,即使用公司的服务就等于同意公司使用交易数据并据此推送信息和商品,而用户基本上不会因为此条款的存在而放弃接受服务。在这种情况下,平台实际成为用户数据的唯一拥有者。随着数据使用范围的扩大,会造成数据滥用,用户数据逐步变成人人可取的东西,用户隐私等权利无从保障,最终导致用户终止交易退出互联网市场,大数据带来的潜在社会福利逐渐消失殆尽。

3.引入外部立法者。如果不存在外部性,立法者拥有设计完全契约条款的自由,就可以在斡旋博弈中探索出为各参与方共同能接受的有效方案。此时,立法者考虑的重点是数据的市场化价值,“如果市场交易成本过高而抑制交易,那么财产权应赋予那些最珍视它们的人。”(13)参见[美]R.波斯纳:《法律的经济分析》,蒋兆康译,中国大百科全书出版社1997年版,第5页。假设用户出售个人数据价值大于平台使用数据价值的话,产权归属于用户,如果平台等其他机构要使用就必须选择补偿用户;相反,则选择将产权分配给平台。然而,外部性的存在是不可避免的事实。在这种情况下,由立法者去测度个人数据交易的市场价值根本无法完成,只能从大数据发展趋势和技术上可以得出产权配置给平台效率会更高。但是,如果受负外部性影响的用户增多、对立法者施加更大压力时,立法将不得已再次将数据产权重新转移给用户,最终会出现上述第一种情况带来的同样结果。

4.明确数据产权由用户和平台共享。可以通过立法规定,使用平台服务产生的各类数据由平台和用户共享。在这种产权框架下,科学设计数据信息的使用规则,明确双方的权利界限。从数据价值产生过程来看,价值更多地来源于数据背后的行为分析而不是原始数据本身,交易数据是自动记录的,用户不可能、也无需操心数据的质量;相反,平台则有动力优化数据处理方式,从而挖掘更多价值。因此,应该把数据的剩余索取权界定给平台,从平台行为数据产生看,平台投入人力物力,为数据的整理和储存等付出努力,理应对这部分数据享有一定权利。在这种共享产权的框架内,平台征得用户同意后,可以将交易数据和姓名、身份证号、性别、家庭地址等个人信息进行配对,进行下一步的开发利用。客户享有基础数据产权,仅仅有权明示反对个人数据的市场化运作,对于数据匹配后推断出的数据,例如通过所购买的商品推断出的身体状况、性取向等,可以行使否决权等,也可以自行采取产权保护措施,如拒绝平台利用Cookie进行追踪的请求,或关掉手机定位功能,或者在第一次接到平台使用数据进行针对性营销时明示反对等。在共享产权模式下,平台使用数据的自由度大大提高,将为下一步数据利用和开发奠定良好基础,从长远看必将推动数据产业发展,从而促进社会福利整体提高。

上述分析看出,单纯地将数据产权配置给用户或平台都不能优化资源配置,尤其是将数据产权配置给平台,最终会导致个人权利受到严重损害。而共享数据产权的设计总体上是帕累托改进,可以有效提高社会整体福利。需要说明的是,数据产权共有和法律上讲的如房屋共有有一定差别,数据共有指的是在交易行为数据产生上,交易各方都做出了贡献,用户是基础数据的来源,各参与方行使权利的条件、约束不同,对于平台来说,最低限度地要满足法律关于隐私保护的规定。

四、清洗数据的产权:权利叠加与分层

(一)数据分类的第二视角

前文已从不同角度对数据进行了分类,为便于理清清洗数据的产权归属,我们借鉴电信领域的业务分类(14)《电信条例》将电信业务区分为基础电信业务和增值电信业务。以及有关研究成果,将数据区分为基础数据和增值数据(15)也有学者从数据内容的产生方式,将数据分为原生数据和衍生数据(也有划分为原始数据和派生数据),能够建立知识产权的数据是衍生数据。参见杨立新、陈小江:《衍生数据是数据专有权的客体值的数据》,载《中国社会科学报》2016年7月13日。http://ex.cssn.cn/bk/bkpd_qklm/bkpd_qkszh/201607/t20160713_3119714.shtml,2017年7月25日访问。。基础数据是关于自然人的最本源信息,这些信息组合起来能够直接或间接识别出特定个人身份,是不依赖其他信息而独立存在的数据。增值数据是指一些原生数据被收集以后,依托计算机技术整合成的可读取数据,例如自然人行为偏好、生理状况等,加工、计算、聚合是增值数据的最重要特征。两者并未完全切割,而是存在密切联系。

随着数据产业的发展,各类数据将会在网络技术支持下全生命周期的、系统地被记录和结构化处理,作为基础数据来源的个人数据也将会无限地被挖掘,个人行为时空均被数字化处理。在大数据技术突飞猛进的背景下,特定数据的跨时空组合使得识别数据主体身份的概率日益提高,保护个人数据变得尤为重要。个人数据的数量、形式、种类不断扩大膨胀,收集和使用的范围边界在动态变化,如果继续沿用以前的标准界定个人数据,很可能导致个人数据保护范围失之过宽,不利于数据资源利用。(16)参见梅夏英、刘明:《大数据时代下的个人信息范围界定》,载《中国法学》2014年专刊。鉴于此,科学界定基础数据范围至关重要。考察当今世界立法,均将可识别性和相关性作为判定基础数据的核心指标。但应该看到的是,基础数据涉及范围非常广泛,这种广泛性往往导致将生活中诸多稍微有点关联的数据均被视为“个人”的信息,除非可以非常明显地判断出此数据与特定个人无法关联起来。(17)参见[德]克里斯托弗·库勒:《欧洲数据保护法公司遵守与管制》(第二版),旷野、杨会永等译,法律出版社2008年版,第99页。

我们认为,基础数据应采取“合理识别”的标准,即常人用常规方法能够识别出某些信息属于特定主体的数据就是基础数据。2003年12月,英国上诉法院在“杜兰特诉金融监管局”案中从狭义角度解释了“个人数据”内涵。法院认为,能够对当事人隐私产生实际或潜在影响的信息,属于个人数据。有学者持不同看法,认为法院对“个人数据”的理解存在偏差,人们在处理数据时,只要能够识别出特定主体身份就会对隐私产生威胁。因此,可识别性是判断个人数据的最关键要素,对于一批正在处理的数据,借助网络技术等能够将特定个人从数据群体中剥离出来,就意味着此人被识别。如果从多种渠道获得各类个人数据的记载,运用技术可以清晰勾勒出某人画像或形成人格拼图时,也就说明此类聚合数据具有识别个人的标志性特征,这类数据属于基础数据的范畴。

(二)增值数据产权归属于添附者

添附是指民事主体通过劳动将不同所有人的财产或劳动成果进行有机组合,从而形成一种新形态财产。如果要恢复原状,在事实上不可能或者经济上不合理,则法律规定由一人取得添附物的所有权或者共有合成物。添附是物权法确认产权的一项重要规则。添附有附合、混合、加工三种类型,增值数据是在基础数据基础上经过算法加工、计算、聚合而成的系统的、可读取、有使用价值的数据,实际上是将收集到个人数据投入人力物力运用大数据技术挖掘整理后的产物,而这一过程正是添附理论的实践展示。此类增值数据均经过清洗,已无法识别个性用户身份,变成了可分析、可视化和可交易的数据产品,实现从“数据”到“可用数据”的创造。洛克指出,付出劳动者应享有劳动产品的财产权(18)参见[英]洛克:《政府论(下篇)》,叶启芳、瞿菊农译,商务印书馆1964年版,第86页。,马克思的劳动价值理论也认为,劳动者拥有劳动创造的价值(19)参见[德]卡尔·马克思:《资本论(第一卷)》,人民出版社2004年版,第127页。。根据上述理论和产权取得的“汗水”原则,数据整理收集者应该享有产权。而这些用于加工聚合的基础数据,可以来自于自身收集、市场购买,还可以从政府开放和共享的数据中获取。承认数据添附者对增值数据的产权,有效保护数据整理、分析者的利益,有助于增加数据交易的法律稳定性与可预期性,遏制数据的非法黑市交易,推动数据产业发展。

(三)两类数据产权的分层与关联

上文已述,显名数据主要包括数据主体的姓名、名称、联系方式等,加上清洗匿名的个人数据,构成基础数据的范畴。当前,个人数据的作用早已超出简单的识别功能,而是在互联网技术整合下,将其与经济活动有机结合,形成了个人资产的重要内容,并成为政府数据、商业数据的核心要素。在产权配置和行使上,基础和增值数据密切相关而又有差异,存在叠加关系。因此,建立数据的二元产权框架对于界定各参与方权利是十分必要的(见下图1)。

图1:数据产权的分层

基础数据是终端用户所存储使用的各种数据,构成了物理存在,如网上购物数据、患者病史信息、社保个人账户数据等等,由于此类数据具备可识别性,大多属于个人隐私范畴,是个人资产的重要构成要素,自然应拥有此基础数据的产权。而在此基础上,添附者因为对基础数据的劳动付出,获得了增值数据产权。从整个架构层次来看,是一种双层权利体系,底层是基础数据权利,上层是增值数据产权。增值数据产权基于来源上的特殊性而具有不完备性,系受到底层权利限制的不完全产权。主要原因如下:

首先,权利性质和位阶不同。清洗后增值的数据来源基础是自然人的原始数据,基础数据更多地承载了用户的身份信息,这类数据兼具财产权和人格权属性,但以人格权利益为主。而增值数据重在经济效益,属于财产权范畴,从某种意义上说,增值数据是人格权商品化的产物。在民法权利体系中,人格权优先于财产权,当两权相遇达到一定的临界点时,财产权应进行避让,财产权利行使中受到人格权一定程度的限制。其次,回应个人数据保护的现实立法要求。考察境内外立法,个人数据保护被放到了十分重要的位置,体现了对互联网侵犯个人隐私的深刻担忧,这方面欧盟走在前列。梳理各国立法,在个人数据收集方面,基本上都确立了目的原则与必要原则。这两项源于基础数据保护的基本原则始终约束着增值数据的开发再利用等。最后,数据技术发展具有一定的不可预期性和不可控性。从大数据发展趋势来看,未来数据技术将会有跨越式发展,很可能对人们观点和生活方式产生颠覆性影响。当前,数据的清洗脱敏进而导致匿名化仅仅是相对的时限性概念,随着数据源的丰富、技术处理水平的日新月异,经过清洗的数据完全有可能重新被识别,甚或经过多次加工、交易、包装流转到境外,这将导致重大的信息安全问题。因此,从维护隐私与信息安全的大原则出发,有必要给增值数据管理加上紧箍咒,约束数据产业链的上下游企业在行使权利时要始终关注基础数据产权的保护。

五、数据权利体系及产权保护基本原则

(一)数据权利体系架构分层

图2:数据权利体系

数据权利体系因主体、客体的不同而相对复杂,我们尝试从不同角度展现这一体系(见下图2)。从实施主体来看,数据权可以依据主体类型不同分为数据公权力和数据私权利。数据公权的主体是国家,是国家对数据进行正常管理和制约的权力,是对境内的数据拥有的管理、监督和保护的权力。分为以下三个方面:一是管理权,即国家对境内数据的生产、传播、交易等全生命周期的管辖权力和司法裁判权。二是控制权,即国家对境内数据的真实、完整性采取有效措施予以保护。三是开放权,即将掌握的公共数据资源向社会公开、共享的权力,换个角度看,这也是现代国家的义务和责任。

对应数据权力,数据私权利则属于民法范畴。在民法体系中,根据权利客体不同,分为人身权和财产权。依此原理,数据权利也应分为数据人身权和数据财产权。(20)参见肖冬梅、文禹衡:《数据权谱系论纲》,载《湘潭大学学报(哲学社会科学版)》2015年第6期。但法学上的财产权、所有权与经济学意义上的产权内涵和外延不同,本文主要使用经济学上产权的概念,且不讨论数据人身权问题。从总体权利层次来说,数据权是笼统的上位概念,数据产权是从权利内容作出分类的下位概念。数据产权和其他产权一样,是一组行为性的集合权利,是一个权利束,包括占有权、使用权、收益权和处置权等。

理论上来说,数据产权的保护方式是多项选择题,可以将其纳入既定法定权利体系加以保护,即处于不同阶段和形态的数据可以得到著作权法、商业秘密法、隐私权法、债法等保护。在数据产权与其他法定权利关系上,存在交叉,二者类似于一般法与特别法的关系。如果能够判别有些数据仅属于个人隐私信息,则以人格权加以保护;如果是汇编创新性作品,就以著作权制度加以保护;如果是有独创性的数据集合,可以商业秘密形式保护。

(二)数据产权保护的主要原则

综观当前数据保护研究成果及有关国家立法实践,知情、自主可控、透明度、匿名、遗忘等构成了数据保护领域的基础性原则,其中匿名和透明度原则尤为重要。我们认为,单体或双边交易的数据可以纳入隐私或商业秘密保护的框架中,互联网平台等集聚的数据则需要区分对待。基础数据往往与人身权紧密相关,对其应侧重从隐私角度保护,增值数据大多是清洗脱敏的匿名数据,应重在促进自由流通。

基础数据保护总体上坚持防止数据滥用理念,匿名化处理是重要技术手段。要根据现行法律规定,区分数据性质,确认数据主体的隐私权、商业秘密权等基本权利,对于健康、财务或性取向等敏感数据的利用,要取得当事人的明确认可与授权。除此之外,可以采取消极同意原则,即用户没有明确反对即可使用,这也是共有产权行使的重要体现。如果显名数据进行下一步利用,必须要进行脱敏,形成新的不具有个人识别性增值数据才可进行交易。在遵守法律关于数据安全规定的前提下,增值数据添附者也要采取可靠的技术措施,重新清洗之后,数据才可以像其他商品一样获得包括知识产权、商业秘密等在内的全方位保护。在这方面,英日做出了有益探索。2014年,英国信息专员办公室在《大数据与数据保护》报告中提出,已经采取有效技术手段充分匿名脱敏的数据不受个人数据保护法调整,相关企业必须对经营的数据进行隐私和信息安全风险评估,若风险较高,该企业就应采取保护性措施,如限定交易对象数量或在合同中明确约束性条款等。2015年8月,日本通过《个人信息保护法》修正案,许可企业在附加义务责任的条件下向第三方出售匿名化数据,约束条件如下:匿名后的数据不能复原、不能识别出特定个体,匿名技术要保密;清洗后的数据不得比对其他信息;合理公布匿名数据中原始数据的要素。

可以说,清洗脱敏是数据保护的重要手段,然而大数据运用存在一个身份识别悖论:既要采取技术手段隐匿用户身份,又要通过数据整合出用户个性数据以便于精准作业,否则大数据技术就没有价值,两者存在冲突。同时,随着信息技术发展,大量数据整合在一起进行关联分析,数据还原和重新识别成为可能性大大增加。美国在线(AOL)于2006年8月,向社会公开了部分旧的客户搜索数据,并进行了脱敏匿名化处理,《纽约时报》短短数日就分析出4417749号代表的是佐治亚州用户赛尔亚·阿诺德。时隔两月,奈飞公司公布了匿名化的约50万用户的一亿条租赁记录,结果很多数据仍被准确识别出具体用户。从上述实例可以看出,计算机技术的整合能力完全可以识别出已经隐藏身份信息数据的真正主人,来源于多元渠道的数据集合分析同样可以暴露用户的身份(21)参见[英]维克托·迈尔·舍恩伯格、肯尼斯·库克耶:《大数据时代生活、工作与思维的大变革》,周涛译,浙江人民出版社2013年版,第198-200页。。这是数据应用场景中难以克服的潜在难点。因此,在两类不同数据管理上,需要科学研究数据的清洗技术,明确清洗形式、方法和范围,避免发生二次识别用户身份的情况,同时,严格数据交易和使用,必要时严禁数据的身份识别和交叉对比。

透明度是数据清洗脱敏后的又一重要措施,是监督数据开发和流转的有力手段。从国际实践来看,坚持透明度原则是解除用户隐私及信息安全风险担忧的核心限制性措施。例如,2014年,美国联邦贸易委员会发布《数据经纪行业,呼唤透明与问责》报告,建议加强数据行业透明度立法,主要包括:(1)公示数据获取渠道、数量、类型;(2)披露对用户特征标签化的处理;(3)对于财务、健康医疗等敏感数据要提高透明性要求等。从国内情况来看,目前侧重于强调企业对于匿名化数据的产权,而忽视了透明性在数据交易中的重要作用。贵阳数据交易所先期完成的11笔数据交易,仅仅是首笔向社会公示了交易主体,其他10笔均未披露相关信息。因此,在明确企业对于增值数据享有产权的前提下,应尽快立法明确具体透明度、责任性等方面的限制性要求。

猜你喜欢

产权用户
产权与永久居住权的较量
自然资源产权关系问题研究
恶意与敲诈:产权滥用的司法原则
共有产权房吹响集结号
关注用户
关注用户
关注用户
Camera360:拍出5亿用户
100万用户
如何获取一亿海外用户