APP下载

区块链技术在电子档案管理方面的应用探讨

2021-06-19刘虎张学干李文姣

山东档案 2021年2期
关键词:进馆哈希共识

文·刘虎 张学干 李文姣

区块链技术是分布式的网络数据管理技术,利用密码学技术和分布式共识协议保证网络传输与访问安全,实现数据多方维护、交叉验证、全网一致、不易篡改。区块链技术开创了一种在不可信的竞争环境中低成本建立信任的新型计算模式和协作模式,具有防篡改、可追溯、去中心化等特性,能够解决在没有第三方中介情况下的多方信任问题。目前,全社会都开始加深对区块链技术的研究,该技术已广泛用于金融、供应链、政务服务等领域。本文将从区块链技术出发,探讨如何在档案工作应用区块链技术。

一、区块链的发展历史及分类

自从2008年中本聪发布《比特币:一种点对点式的电子现金系统》以来,区块链经历了从1.0、2.0向3.0发展的阶段。区块链1.0阶段,主要探索的是区块链本身的技术应用,研究的重点是其作为安全货币和分布式账本的作用,其代表是比特币;到了2.0阶段,区块链的发展趋势与重点变为如何更好地与日常生活相结合,实实在在地解决一些日常生活中的需求,其中包括我们熟悉的物流网络、物联网、万物互联等这些相互关联、形成一个综合网络的互联互通技术,其代表是以太坊;而到了3.0阶段,区块链将与大数据、人工智能技术融合,实现新的模式创新。区块链3.0与区块链1.0、2.0最重要的一个区别,就是这种技术的使用方式与领域,而非其底层技术的变化,主要表现在通过区块链技术实现个人全部信息的综合传递和安全存储,如果实现了这一点,将会给整个社会带来巨大的变化。

根据不同的应用场景和用户需求,区块链可以分为公有链、联盟链和私有链三类。其中,公有链是对所有人开放,任何人都可以参与区块链数据的维护和读取,数据完全公开透明,其典型案例就是比特币、以太坊系统等;联盟链通常在多个已知身份的组织之间构建,如银行之间的支付结算、政府部门间的数据共享,多个企业之间的供应链管理等;私有链仅仅在组织内部使用,只对单独的个体或实体开放,适用于政府、企业部门内部的管理。这三类区块链特性对比如下表所示:

?

通过上表可以看出,在现有档案管理背景和技术条件下,公有链不适合应用于电子档案管理工作,主要是在公有链中任何人都可以参与到区块链中,在链上传输和存储的数据都是公开的,由于很多档案具有保密性、隐私性,将档案上链,不符合档案的安全保密需求。私有链或联盟链安全性、效率比公有链高,有相应的权限管理体系,尤其是联盟链能够将不同的区块链连接起来,可以应用在明确的机构之间,更契合档案管理实际情况。

二、区块链核心技术

区块链是一种数据的记录格式,就像Excel表格一样,是按照一定的格式数据存储在计算机中。但与传统方式不同,区块链是将数据按照一定的时间间隔,分成一个个的数据块记录,然后再根据数据块的先后关系串联起来,就组成了区块链。其基本的技术组合主要包含以下五个方面,如图所示:

1.区块链账本

就是区块链数据,逻辑机构是“区块+链”。所谓的区块就是指数据块,数据块之间通过某个标志连接起来,从而形成一条链。

如图所示,每个区块分为区块头和区块体。区块和区块之间通过区块头哈希值(区块头哈希值就是一个区块的身份证号)串联起来,形成了区块链。这种链条格式最大的特点就是一环扣一环,后面区块中包含前面所有区块数据的特征值,从而保证了数据很难被破坏。

由于区块链是去中心化的设计,系统中每个节点都可以保存全部的数据,因此,一个节点产生的数据或者更改的数据都要发送到网络中的其他节点接受验证,而其他节点是不会验证通过一个被篡改的数据。因此,这种特殊的链式结构+去中心化的存储方式构成了区块链数据不可篡改的一个重要的技术设计。

2.共识机制

所谓共识,就是指大家都达成一致的意思。由于区块链是一个去中心化的结构,在这个结构中没有哪个节点是“老大”,一切都要商量着来,而这个商量出来的解决方案就是制定共识算法。

共识算法其实就是一个规则,每个节点都按照这个规则去确认各自的数据。常用的共识算法主要有PoW(Proof of Work,工作量证明)、PoS(Proof of Stake,权益证明)、DPoS(Delegate Proof of Stake,委托权益人证明)、PBFT(Practical Byzantine Fault Tolerance,实用拜占庭容错算法)等。传统的比特币、以太坊币等采用的PoW共识算法,需要通过“挖矿”达成共识,造成极大的能源消耗,一直以来广受诟病。联盟链中的各个节点都是经过审批加入的,有严格的身份认证和权限管理,处于可信的执行环境中,可以很大程度上消除恶意节点的不规范或恶意操作。所以,在档案区块链中,可以采用DPoS共识算法,不需通过“挖矿”这类耗费资源的办法就能快速达成共识,并将事务按顺序打包进入区块链,保证系统中各节点账本的一致性。

3)小麦生长中后期强降雨伴随大风天气往往造成倒伏[8]。 2017年 4月 8~9日,襄阳市襄州区降雨量达到45 mm以上,并伴有大风,最大风力达到12.8 m/s。强降雨伴随大风天气是造成此次小麦严重倒伏的主要外部因素。

3.密码算法

密码算法是区块链数据不可篡改的一个重要保证,在区块链系统中应用很多。这里主要介绍两个关键应用。

第一个是区块之间的连接。在区块链中,是一种叫作哈希值的数据来进行的连接。所谓哈希值,就是通过密码算法中的哈希算法对区块链中的事务数据计算得出的一段摘要字符串。而这个摘要字符串与原始数据是唯一对应的,原始数据出现任何微小的变动,计算出来的哈希值都会发生完全的变化。区块链账本对每个区块都会计算出一个哈希值,称为区块哈希,通过区块哈希来串联区块。这种结构的优点是,任何一个区块发生变动,它的区块哈希就变了,也就指不到后面正确的区块了。

第二个是梅克尔树结构。在区块链中,除了整个区块会被计算哈希值外,区块中包含的每一笔事务数据也会被计算出一个哈希值,称为“事务哈希”。将区块中所有事务哈希进行加工处理,最终会得出一棵哈希树的数据结构。哈希树的顶部称为“梅克尔根”。只要区块中的事务有任何改变,梅克尔根就会发生变化,利用这一点,可以确保区块数据的完整性。

4.脚本系统

脚本系统决定了区块链系统之所以能形成一个有价值的网络。所谓脚本,就是指一组程序规则。在区块链系统中,有些系统中的程序规则是固定的,比如在比特币系统中;而有些系统是允许用户通过编写脚本扩展区块链系统的功能的,比如以太坊就是智能合约功能。在区块链3.0阶段,脚本系统能使区块链实现更多的功能。

5.网络路由

区块链系统是一个去中心化的、分布式的网络,网络中的节点进行连接通信依靠的就是网络路由。在区块链系统中,不存在一个指定的服务器,大家没法通过一个服务器来直接交换彼此的身份信息,就只能依靠彼此联系并传播信息。在区块链系统中,这个功能一般会定义成一种协议,称为“节点发现协议”。

除了发现节点外,另一个功能重要功能是同步数据。节点要保持自己的账本数据是最新的,就必须要时时更新自己的数据。怎么更新?就是通过网络路由进行更新。

网络路由可以说是区块链系统中的触角,通过大量的触角将每个节点连入网络,从而形成一个功能强大的区块链共识网络。

总体来说,区块链技术并不是单一信息技术,而是依托于现有技术,加以独创性的组合及创新,从而实现以前未实现功能的技术。

三、区块链技术在档案工作的应用展望

随着电子档案单套制的加速推进,将区块链技术应用于电子档案管理工作,推进电子档案与区块链技术的深度融合是档案工作者的一个重点研究方向。国家档案局近几年的科技项目立项选题指南中就均设有区块链技术相关内容,中国石化已经使用区块链技术对档案进行存证和验证进行了尝试。下面,笔者按照自身的理解,尝试展望一下区块链技术在档案工作中的应用。

首先说明,使用区块链技术,并不是要把所有应用都使用区块链技术,而是要仔细分析各种业务场景实际情况,在充分发挥区块链技术优势的基础上,有选择地应用区块链技术。区块链技术的应用优势,是解决非信任环境中的信任问题和价值传递。因此,使用区块链技术,应重点考虑在多方参与的复杂应用场景中使用。为充分发挥区块链核心作用——存证、自动化协作和价值转移,结合工作实际,档案区块链可以分两步建设以实现以下功能。

第一步,搭建档案区块链,将档案数据的哈希值和业务移交办理信息上链,实现档案移交进馆业务的上链办理。

在政务云平台上建立由档案馆牵头、各进馆单位通过授权加入的档案区块链。按照电子档案进馆要求,明确各方的权利和义务。在电子档案移交进馆,即电子档案的权属发生转移时,移交方首先将电子档案进行哈希运算,然后将电子档案及其哈希值一起移交给接收方。当接收方收到电子档案后,可提取电子档案哈希值与接收到的哈希值进行验证,如果一致,说明接收方收到的电子档案确实是发送方发送的且内容没有被修改过。接收方确认无误后接收电子档案及其哈希值,然后将哈希值和接收信息上链存证,各参与节点根据共识机制同步确认并保存该哈希值和移交信息到区块链账本。按照这种机制,上链存储的并不是电子档案的全文内容而只是哈希值,因此不会导致电子档案内容的泄露,从而保证了电子档案信息的安全。

第二步,随着安全技术的进步,有计划的将档案数据上链,实现档案管理和利用业务的上链办理。同时与其它区块链系统建立信息交换机制,实现电子档案信息在不同链之间的数据互通、价值流动,充分发挥区块链价值传递的优势,为社会提供更便利、价值更高的档案信息服务。

通过政务网平台,将档案区块链与其它区块链连通,建成多种信息互通的联盟链。按照联盟链模式建立更加完备的权限控制功能,使用跨链技术,搭建链与链之间可信交互渠道。在使用传统安全技术如数据加密、权限控制之外,引入零知识证明、同态加密等新型安全技术,实现档案数据上链管理的同时达到数据“可用不可见”的更高安全级别。

在这种应用场景下,档案区块链可实现以下功能:

在档案移交进馆环节中,利用区块链智能合约的透明可信、自动执行、强制履约的特点,将各单位的文件材料归档范围、档案保管期限、档案元数据与全文,以及开放鉴定等要求写入智能合约,实现到期档案的自动检查和移交进馆,在规范档案移交进馆工作、提高档案数据质量的同时,达到档案移交进馆的自动化处理,极大减轻移交进馆环节工作人员的工作量。

在档案管理环节,利用区块链技术去中心化、防篡改的特点,建立多个存储全部数据的共识节点,实现档案数据存储、备份的一体化管理,在极大提高数据安全性的同时,充分借用区块链分布式存储特性降低档案馆工作人员的日常维护难度和成本。

在档案利用环节,利用与其它区块链连通形成的联盟链,实现档案信息与其它信息的可信交互和综合利用,打通“链级孤岛”,实现更大范围和规模的数据共享和多方协作,建立可容纳各行各业档案信息和其它信息的服务平台,为更好的服务民生、为政府治理水平和治理能力的提升,提供更强大的信息支撑。

目前,许多档案工作者开展了区块链技术在电子档案共享利用、真实性保障、安全管理等方面广泛性研究,并取得一定的成果。但总体来说,区块链技术在电子档案管理中的应用尚处于探索阶段,随着区块链技术的逐渐成熟,可以肯定,区块链技术与电子档案相结合,必然会产生重大影响,档案工作者应紧跟时代步伐,充分利用区块链技术的优势,推动档案工作提质增效。

猜你喜欢

进馆哈希共识
关于开展铁路建设项目档案进馆工作的思考
红河州对脱贫攻坚档案接收工作提出工作要求
共识 共进 共情 共学:让“沟通之花”绽放
哈希值处理 功能全面更易用
Windows哈希值处理不犯难
文件哈希值处理一条龙
论航空产品档案进馆实施策略
商量出共识
军工产品档案进馆研究
巧用哈希数值传递文件