APP下载

大数据技术在侦查应用中的风险与法律规制

2021-12-28闫霞飞

辽宁警察学院学报 2021年5期
关键词:个人信息算法信息

闫霞飞,叶 兵

(福建警察学院 侦查系,福建 福州 350000)

随着智能互联的迅速发展,我国已经进入了双层空间—虚实同构的社会结构。[1]为了遏制新型电信网络犯罪的高发态势,侦查工作逐渐侧重大数据技术,实现“网络化环境”①下对犯罪的预防与打击。由于大数据技术的前置性,使得基于数据情报研判下的侦查活动,发生侦查时点前移的情况,这与传统侦查活动形成显著区别。其一,鉴于大数据技术具有二次或多次计算特征,通过数据建模技术获取、处理、利用个人信息的侦查行为,已打破传统古典契约理论的框架限制,②出现数据脱敏效用骤减现象,有违正当程序的法律要求。其二,算法的不同是大数据技术区分的标准之一。面对算法推荐存在的风险和挑战,如何保障数据安全,这一问题成为能否赋能助力侦查部门犯罪治理能力现代化所面临的重要课题。其三,随着技术深度参与取证过程,侦查机关通过大数据提炼问题、模型与方法,根据算法推荐的结果查明案件事实的做法,是否压缩了法律论证的司法裁量空间?法律判断是否会沦为基于算法的机械型行为?面对算法推荐带来的风险与挑战,深入讨论大数据技术在侦查中的应用现状与面临形势,让数据与算法为经济社会发展注入正能量,具有重要的探索意义。

一、大数据技术在侦查应用中的基本问题

从历史发展和人类认知的角度来看,[2]科学技术的发展与侦查活动的融合,客观上为现代侦查的产生奠定了基础,可以说侦查活动随着自然科学的发展,而不断得到创新和完善。

(一)大数据技术与侦查工作的融合

“侦查工作是一个技术不断向侦查渗透和渐进的过程。”[3]马方教授将这一过程进行了区分,主要有信息嵌入期、系统集成期和体系集成期三个历史时期。[4]李双其教授进一步指出,目前侦查工作正处于信息技术革命向第四次技术革命挺近时期,这一时期的侦查活动面对的是更加错综复杂的网络犯罪手段。③根据打击犯罪现实需要,由此形成的新型侦查模式,体现为线索获取研判更为智能化、技术化,侦查主体思维逐渐数据化、侦查客体处于双重空间化、侦查方法更侧重数据串联、比对和深度挖掘等方面。

(二)大数据技术融合下的“数据导侦”新型侦查模式

这种以大数据技术为引导的“数据导侦”新型侦查模式,是指随着大数据技术的发展,不断进行演变和创新的一种侦查活动,在实现数据集合化、聚合化的条件下,利用已有的信息或侦查过程中即时获取的信息,在信息网络空间对犯罪手段进行各种侦查的行为。其具有四项特征:其一,“数据导侦”模式是以信息网络虚拟空间为主战场。其二,以信息技术的发展来实现不同程度数据的集合或聚合作为外部保障和条件。其三,侦查客体是以信息权利为对象的犯罪行为。犯罪活动在信息技术的影响下,犯罪空间变得更为错综复杂,犯罪手法不断创新,变得更为隐蔽,侦查打击难度加大。仅依靠传统侦查手段已难以承担社会防控职责,侦查主体必须以先进的科技成果进行武装,才能在与犯罪活动的对抗性中占据主动。其四,侦查方式随着大数据、人工智能技术的发展,而处于持续演变和革新的状态。

(三)“数据导侦”模式中的技术特征

侦查机关通过对个体或群体在网络社会中产生的海量基础的、动态的数据进行系统加工、计算预测,最终完成虚拟社会中的犯罪行为人员画像分析。④依靠利用信息是数据引导侦查模式中的重要方式。即从已有的公安数据库、第三方数据库或互利网网络平台数据等信息入手,在虚拟空间以数据跟踪、数据穿透等技术进行资金溯源;利用网络安全信息技术手段追溯定位作案设备,收集电子形式的痕迹物证。由此可见,大数据侦查与“信息”密切相关。[5]信息的特性很大程度上决定了数据导侦模式中的技术特征。其一,数据模型化特征。大数据技术改变了侦查主体的认知范式,即基于大数据全数据的定量分析使创构型认知成为一种现实,正如目前广泛应用于侦查工作中的数据建模⑤。此项技术正是基于数据前置性特征,使得物的数据化或者数据的物化过程成为现实,正逐渐应用于电信网络诈骗犯罪治理过程。⑥其二,算法的自我适应性特征。人工智能技术中机器学习作为算法,逐渐具有鲜明的自我适应性。这种鲜明的自我适应性特征是建立在对数据的不断掌握和学习技术上,掌握的数据越多,他们的工作就会越顺利。其三,算法的高速迭代性。为了更大的利益空间,智能服务提供商开始将大众化和智能化相结合,例如,警务机器人、家政机器人等将大量出现,并承担具体的劳动行为、任务合作、智能决策等角色。这些智能机器人通过对环境或个人具体需求的敏感感知和体验,不断收集获取观察数据、动态数据,对海量关联数据进行建模分析,通过自我选择和判断,进行内部排除,形成决策结论进行推荐。如侦查机关在案件侦办过程中,更多将算法结论作为执法决策的依据或根据。

二、数据建模技术在侦查应用中的风险与规制困境

(一)应用数据建模技术存在的隐性风险

1.个人信息非法收集、过度使用。在大数据环境中,人逐渐被信息化中。[6]正如约翰·帕克所言:“对个人而言,网上的个人信息全方位覆盖了你从摇篮到坟墓的全部私人生活,慢慢地积累所有数据,直至在计算机数据库汇中形成了一个‘人’”。[7]首先,存在非法、过度收集个人信息的行为。例如,侦查机关利用第三方数据库或互联网平台数据,进行调取用户的隐私信息行为。其次,存在过度挖掘或使用个人信息的行为。例如,数据建模应用中,侦查机关利用大数据技术将海量的个人信息进行关联,通过事物发展的内部关系强度和正负性质获得认知,进行全数据定量分析,揭示未知的规律,并进一步将其模型化。对犯罪行为进行预测和分析,使侦查时点进行前移,对犯罪行为进行预防。这就意味着一部分在未确定为犯罪行为之前,进行数据挖掘、分析的侦查行为,有主动侦查和滥用侦查权之嫌。最后,存在非法泄露个人信息的行为。近年来,我国部分机构工作人员违反职业道德和保密义务,出售、泄露个人信息获取非法利益的案件数量日益增多。[8]

2.应用算法不透明,侵权行为更具隐蔽性。基于复杂的算法下,在数据输入后,产出的结论是未知和不可控的。[9]以智能爬虫技术为例,从技术的角度来说,一般爬虫程序会按照设计者的思路和指令来执行,呈现非自主性和纯技术性的特征.网络爬虫会在触发条件实现时,实施自动化数据抓取,再由技术人员通过一定的方式处理收集到的数据。[10]而大数据技术下,网络爬虫技术设计者总是按照一定的抓取策略将算法引入网络爬虫,以提高爬取内容的质量和效率。但是,在爬虫对特定服务器访问频次过高,或不当使用该技术,都会造成服务器超载乃至瘫痪,引发侵权行为的发生。[11]由于算法的复杂性、不公开性,算法背后的设计者以及操控者的侵权行为更为隐蔽,⑦难以发现。近日,浙江省绍兴市检察机关在其官网公布越城区检察院对周某某等7 名被告人提起公诉的新闻稿,轰动一时的“史上最大规模数据窃取案”正式进入审判程序。[12]该案例中,涉案公司为了更便于从源头获取大量信息,自主设计、编辑大量筛选软件,私下恶意植入有关窃取信息的程序放置于服务器中,获取了共计30 亿条用户信息。数据建模技术、网络爬虫等技术依托企业公司进行技术研发,侦查机关利用大数据技术,就需要以正常的商业服务的形式购买技术服务。值得注意的是,如何避免因算法设计者或操控者的不当使用或设计,而产生的侵权风险行为的发生。

(二)规制数据建模技术风险的显性困境

1.个人信息去识别化规制存在实践困境。个人信息不仅关系到公民个人人格权和虚拟财产权,更关系到社会、国家的安全。纵观各国,对个人信息普遍采取“数据模糊化处理”的保护手段。⑧但事实上,这一手段的作用也只是有限的。数据的收集与模糊化处理,是基于公司的作为不恢复数据承诺上的一种解决方案。然而,有目的性的模糊化处理可能使数据丧失其实用性以及降低相应法律责任。[13]此外,对个人信息去识别化或进行数据模糊化处理过程中存在实践性难题,这是因为进行数据匿名化、模糊化,本身与数据深度利用之间存在一定的矛盾。在我国,个人信息去识别化是构建刑法保护的逻辑前提,在上述矛盾与问题无法解决的情况下,对个人信息进行刑法规制仍欠缺可实现的必要条件。

2.技术发明者、操纵者使侦查权主体泛化。信息管理、信息价值随着云计算、人工智能等信息网络技术发展,尤其是在互联网普及率达到70.4%⑨的当下,信息量的体量(亦称为大数据)不论从其含义还是其现实意义都对人类行为模式产生了影响性的挑战[14],个人信息正逐渐成为公民基本权利的对象,也正是国家权力行使的重要资源和媒介,信息成为权力行使的作用力,体现为三个方面:其一,社会信息化扩张了权力的广延性,即权力运作不再受物理边界和法定权力主体的限制。例如,在传统社会下,社会执行规范为国家权力机关藉由同意或协商所垄断,但是在数字技术影响下,社会规范的执行权力主体被稀释或打破,国家不再作为执法行为的唯一提供者,执法活动越来越多的以“分包”的形式进行,正如数据建模技术应用中,更多的互联网公司、科技公司等私主体逐渐转变为执法权力中介,稀释着公安执法部门的侦查权力。其二,大数据技术改变了人们对事物的认知范式。传统社会中的数据处理范式体现为经验范式、理论范式等,在大数据时代下,产生了新的范式就是数据挖掘范式。这一范式表现为侦查人员基于对数据全面、深度的搜集和挖掘,形成了侦查假设或认知对象。此时,信息的传递性和共享性,使跨界搜集和共享数据成为常态,这一转变使侦查权行使初始的对象和领域变得模糊,使侦查权运行因难以事先预测,而出现可能辐射的事项范围日趋泛化的趋势。利用数据建模技术运作的侦查权,是在未获取法律授权下搜集信息或在缺失正当程序比例原则限制下使用数据,这都与法律正当程序的要求背道而驰。其三,基于大数据技术下,进行侦查结论的输出更具说服力。侦查部门利用数据建模技术,即对数据进行选择性收集、筛选、拼组以形成的信息,并以此形成的侦查结论强化了侦查部门说服嫌疑人、法官等主体的能力。

显然,在数据导侦的模式下,侦查主体利用数据获取和分析技术,所形成的侦查结论信息,使得作为犯罪嫌疑人权利救济的辩护方,在切实的数据技术和分析能力的差距下,呈现出权利救济与权力行使相剥离的趋势。在这种模式下,互联网公司、科技公司等私主体逐渐稀释侦查权,侦查主体泛化的趋势使侦查侵权行为更为隐蔽难以发现,而且被侵害的诉讼权利也难以得到保护和救济,有成为社会治理新的难题之虞。

三、数据建模技术在侦查应用中的风险规制与法律应对

(一)构建“公权管制与私权自治”相结合的风险管控体系

谁掌握数据,谁就有可能成为实际权力的执行者,此时的信息逐渐质变为权力的基础。随着网络社会的形成,人们在网络空间遗留了大量的数据痕迹,这些数据被存储在各个P2P 平台、互联网企业、搜索引擎等存储介质中,并为这些网络平台的各方主体提供具有商业价值的数据分析基础。然而这些数据并不会主动、全面、及时的被录入到公安数据库,公安机关要利用大数据技术,就必须借助这些大型互联网公司企业进行数据披露,对犯罪人身份、犯罪被害人、潜在犯罪人、犯罪活动等进行预测,这使得侦查活动启动时点进行前移。在数据导侦的模式下,这一特征更为明显。这需要区分两种情况:其一,基于数据建模技术进行数据收集和分析先与侦查人员对犯罪事实及刑事责任的认知。这常体现在案件初查阶段。⑩这一阶段的侦查机关在借助第三方数据记录、大型数据库的行为只需由互联网等大型数据公司按照行业规定,在数据存储和数据披露义务方面进行自治管理。其二,在侦查机关利用大数据预测技术对涉案物品、资金、账户、人员等进行预测分析、研判获取的情报,只能作为侦查线索而非执法依据或认定事实的证据基础。此时必须由立法设置明确的取证程序和证据规则,来实现对大数据证据成为滥用强制侦查措施依据的限制。

(二)完善信息资源“事前授权—泄露通知”相关责任制度

“信息资源”使用缺失法律授权。“各类信息资源在侦查工作中发挥着巨大的作用是确信无疑的。目前信息资源的使用缺乏基本的法律授权,尚未有法律对信息资源的使用进行规范。尤其是公安网信息、通信信息、视频信息、其他社会信息这几类信息资源的使用更是无法可依。不知不觉间,利用信息资源的过程中对于宪法所保护的公民基本权利存在着相当程度的侵害。”[15]应该出台利用信息资源的相关规定,尤其是公安机关应该对公安内部网络信息资源的使用作出规定,对于数据获取、固定、保存乃至销毁等行为都必须一一进行规范,对信息使用过程中所造成的责任和救济也应该符合正当程序。

(三)引入“技术正义”的司法审查机制

在侦查阶段构建正当程序,不仅需要对法定侦查主体行为进行司法审查,还需要对躲在算法或互联网平台后面的设计者、操纵者这一泛化的侦查主体进行“正义”价值引导的审查。

第一,要区别一个误区:“技术中立”不同于“价值中立”。⑪要实现侦查阶段的正义价值,不仅需要法律对“信息资源”进行事前授权,仍需在事中构建以司法审查为核心的监督制约机制,以防止因算法不公开、不透明等技术黑箱下,而导致的权力滥用与侵害合法诉讼性权利的发生,消除隐性权力存在的空间。在诉讼当事人认为,公安机关或检察机关有算法独裁之虞或者存在利用技术的不公开、不透明的优势,导致其进行法律论证的空间被压缩或被剥夺的情形的,就可以启动司法审查机制。在数据导侦模式下的数据获取、存储、传递以及销毁等侦查行为,需要审查机关(法院或检察院⑫)基于正当程序中的比例原则、合目的原则、以及安全保护原则进行司法审查。一旦发现侦查主体未基于事前法律授权,就使用信息资源进行信息化侦查的情形,依法裁定中止侦查活动,待侦查机关作出合理解释的,则恢复侦查活动,否则裁定终止该项活动。

第二,同时基于技术算法是否符合“公平正义”的法哲学价值,对智能技术的设计者或互联网、各平台的幕后操纵者进行合宪性审查,以保证侦查机关用以发现案件事实、收集线索和证据的技术算法,符合“正义”的法哲学价值的引导。诉讼当事人或辩护律师,认为侦查机关基于的技术算法存在侵害宪法所赋予公民的基本权利之虞的,可以向法院对技术设计公司或互联网公司提请合宪性审查。为了保证侦查行为的正常进行,及时查获犯罪嫌疑人,查明案件事实,在合宪性审查期间,侦查机关不停止侦查行为,只有在法院依法作出裁定后,方可中止侦查行为,更换技术待法院审查后,恢复侦查活动。

需要注意的是:首先,诉讼当事人可以基于法院裁定,启动非法证据排除。其次,如果在审查期间发现存在侦查机关有滥用技术之虞情形的,需要同时对侦查行为启动司法审查程序的,经审查确实属于技术滥用的,依法裁定终止侦查程序,并就基于该项技术获取的证据存在的法律风险,进行审查,以决定是否予以启动非法证据排除程序。最后,经审查,发现既无技术滥用之虞,也不存在因技术黑箱导致侵害宪法性权利情形的,依法作出裁定,此后,诉讼当事人及律师不能就该事项再启动审查程序,除非存在新情形。这种通过司法审查机关干预侦查工作机制的设立,其实质在于以审查程序监督制约权力滥用的方式,实现在数据导侦模式下侦查行为的正当性,杜绝或尽力避免因使用各种信息资源带来打击犯罪高效的同时,以牺牲公民个人信息基本权利为代价的结果的发生。

注释:

①信息化侦查依照依托的信息系统为界限,可以分为利用公安网信息资源、利用互联网信息资源、利用视频信息资源、利用通讯信息资源、利用 GPS 信息资源、利用银行卡信息资源、利用其他社会信息资源、综合利用信息资源及其他信息化侦查方法等九类。此处的信息化侦查应做广义上的理解,即只要在网络化环境中展开的侦查就是信息化侦查。是一个以犯罪情报系统为核心的网络化环境。李双其:《论信息化侦查方法》,《中国人民公安大学学报》,2010 年第4 期,第9-11 页。

②传统的个人信息收集与使用建立在授权与许可的基础上。然而数字化技术在进行数据比对、挖掘中,无法对未来可能使用的方法进行全面预估,这就使得在开始环节的具体授权不具有可操作性。

③近年来,由于互联网、物联网、大数据、云计算、人工智能、区块链等技术的继续渗透与融合,以及暗网的扩张,使得侦查活动的客体变的更加错综复杂。此时的信息化侦查主体需要引入“大部门制”,选择“大侦查”战略中引入数据思维。李双其:《信息技术革命向第四次工业革命演进时期的侦查策略选择》,山东警察学院学报,2020 年第5 期,第47-51 页。

④在信息时代下,大数据技术将社会全方位、全领域的信息进行数据化与可视化,成为一种不受相对权利人控制的数据画像。在大数据环境中,不仅物被信息化,人也逐渐被信息化中,直至在网络虚拟社会中形成一个“人”。【英】约翰·帕克:《全民监控—大数据时代的安全与隐私困境》,关立深,译,金城出版社,2015 年版,第14 页。

⑤此项技术就是基于大数据技术下,按照既定目标对非结构化、半结构化数据进行探索式分析,通过揭示隐藏性、未知性的数据规律,并将其进一步模型化,从而加以运用于犯罪行为的预防。

⑥尤其是对利用流氓软件、手机病毒、App 等网络平台实施的网络诈骗、网络赌博等犯罪行为的打击。

⑦这一特征强调算法可以通过学习人类生活的各种数据,进行加工、分类、自我选择出“最优解”作为算法结果进行推荐。

⑧例如,美国白宫发布的2014 年全球大数据白皮书的研究报告《大数据:抓住机遇、坚守价值》提出,“数据的模糊化处理作为保护个人隐私的一种手段”。

⑨根据中国互联网络信息中心发布的中国互联网发展状况统计报告显示,截至2020 年12 月,中国互联网普及率达70.4%。

⑩例如,2106 年《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》中规定的,初查阶段进行收集、提取的电子数据可以作为证据使用。

⑪避免价值观成为技术的附庸,致使技术发明者、互联网行业自身的操纵者无视规范、漠视价值现象发生。

⑫检察机关作为国家法律监督机关,在审查批捕阶段,有权就采取的侦查技术是否存在侵害个人信息的行为进行法律监督。此外,在审查起诉阶段,检察院作为控诉机关,有权对侦查机关基于大数据技术获取的证据进行审查,排除因技术滥用而导致证据存在的法律风险。

猜你喜欢

个人信息算法信息
个人信息保护进入“法时代”
哪种算法简便
敏感个人信息保护:我国《个人信息保护法》的重要内容
主题语境九:个人信息(1)
警惕个人信息泄露
Travellng thg World Full—time for Rree
进位加法的两种算法
根据问题 确定算法
订阅信息
展会信息