APP下载

基于区块链的可验证医疗数据统计方案

2019-03-18叶俊于天娇郭祯荆兆星

网络空间安全 2019年12期
关键词:智能合约区块链

叶俊 于天娇 郭祯 荆兆星

摘   要:目前,数据统计广泛应用于社会经济生活的各个方面,对医疗数据进行统计已成为医院工作不可或缺的环节,然而传统的方法存在数据篡改、信息泄露的风险。文章基于区块链技术,提出了一种新型的医疗数据统计方案,利用区块链的不可篡改性,有效避免了数据篡改的风险;使用同态加密和保序加密算法,实现链上数据的隐私保护;利用智能合约一方面对密文进行统计,确保统计结果的正确性;另一方面,实现在密文状态下的数据排序。若某机构对排序结果存在异议,可向监管机构提出申请,监管机构通过解密链上数据进行结果审查,并将审查结果返回,实现结果可验证。

关键词:区块链;同态加密;保序加密;智能合约

中圖分类号:TP309          文献标识码:A

Abstract: Data statistics work involves various aspects of socioeconomic activities nowadays, and the statistics of medical data has become an indispensable part of hospital work. While the traditional methods have the risk of data tampering and information leakage. Based on the blockchain technology, a new data statistical scheme is proposed in this paper. The non temperability of blockchain is utilized to effectively avoid the risk of data tampering. Homomorphic encryption algorithm is used to achieve the privacy protection of data on the chain. At the same time, the ciphertext is counted regularly by using the smart contract to ensure the correctness of the statistical results. On the other hand, the statistical results are encrypted with order preserving to achieve data sorting in ciphertext state. When an institution has any objection to the ranking results, it can apply to the supervisory authority, which will review the results by decrypting the data on the chain and return the review results, so that the results can be verified.

Key words: blockchain; homomorphic encryption; order-preserving encryption(OPE); smart contract

1 引言

统计是通过数字来揭露事务在一定时间内的数据变化规律,可有效帮助人们对事务进行定量分析,从而促进人们做出正确的决策[1]。大到对国家GDP、人口数据的统计,小到对学生成绩统计,数据统计已涉及到社会、文化、国民经济、人民生活等各个领域,通过统计可以实现对不同事务进行有联系的定性分析。

数据统计作为经济信息的重要组成部分,在社会经济中发挥着极其重要的作用,准确无误的统计结果是检测社会经济活动规律的重要指标之一,是进行科学决策和管理的重要依据。然而目前数据统计采集仍然存在较大问题:一是统计基础工作薄弱,统计工作人员对原始数据记录混乱、拼凑数据、数据逻辑性错误等,极大影响了后期整理难度,降低了数据的真实性和有效性;二是报表人责任意识弱,工作敷衍不严谨,对统计数据来源不能严格审查,严重影响统计数据质量;三是缺乏有效评估和监督机制,部分统计部门为了局部利益会对统计工作进行行政干预,纵容统计数据作假,数据统计不透明,很难确保统计结果的准确性[2]。

在现代化医疗体系结构中,每个病患在就诊过程中会产生大量的电子医疗记录,其中包括患者的个人信息、病历及各项检查数据等。这些记录通常会传送到医疗的云服务器中存储,这不仅给病历数据的统计带来便利,也节省了大量医生手写病历的时间。高效准确的医疗数据统计以及统计数据价值的有效流通,给医疗机构科学决策和科学管理提供了可靠的数据依据[3]。然而在统计过程中,一方面因大多数医院信息化技术人员水平不一,导致统计结果的正确性相差较大[4];另一方面各医院相互独立进行统计工作,存在数据易篡改问题,而且无法实现统计数据共享。因此,亟需改善现有统计方案,增强数据统计的正确性和可共享性。

比特币[5]市值的一路增长,其底层区块链技术也得到政府、企业和学术界高度的重视。我国也相继出台了许多关于区块链的发展政策。2016年,《关于印发“十三五”国家信息化规划的通知》[6]中,首次将区块链作为一项战略性前沿技术、颠覆性技术。2017年,国内多省份、直辖市均出台了针对区块链产业发展的相关指导意见和区块链专项扶持政策,加快了各地区块链的发展步伐。2018年10月8日,海南省工信厅正式授牌海南生态软件园设立“海南自贸区(港)区块链试验区”,该试验区是国内首个正式授牌的区块链试验区。

区块链作为一种新型分布式数据库存储技术,具有开放性、可追溯、不可篡改等特性,对于解决数据统计面临的数据易篡改、结果不准确等问题有着天然优势。然而链上数据具有高度透明性,为了保证链上数据的隐私性,有必要在数据上链前进行加密处理,且需要采用一定的技术完成对链上数据的匿名操作。

保序加密(Order Preserving Encryption,OPE)于2004年由Agrawal等人[7]首次提出,该加密方案使得密文与明文保持相同的顺序,可以实现在不透露任何明文信息的情况下,直接对密文进行查询操作,且达到与明文查询相同的效率,能够很好保护用户数据的隐私。保序加密分为一对一保序加密和一对多保序加密。前者指相同的明文加密得到相同的密文,后者指同一个明文可能得到不同的密文。Boldyreva等人[8]引入了保序明文不可区分的安全性定义(Indistinguishability under Ordered Chosen Plaintext Attack,IND-OCPA),并证明该保序加密密文是线性增长的,故不能够达到理想安全性的目的。后提出选择密文攻击下伪随机保序函数(Pseudorandom Order-Preserving Function under Chosen Ciphertext Attack, POPF-CCA),并提出相应的保序加密方案。Popa等人[9]提出一种新型的保序加密算法(mOPE),该方案实现了理想的IND-OCPA安全。Florian Kerschbaum[10]提出了一种隐藏频率的保序加密方案,通过随机化密文来隐藏明文的频率,在保证信息机密性的同时增强了密文安全性。

本文针对目前存在的数据统计中易篡改、易泄露等问题,提出了基于区块链技术的可验证数据统计方案,使用区块链降低第三方信任机构的约束,增强了数据透明性,同時很好的抵御了数据被篡改的可能。采用同态加密和保序加密实现对链上数据的隐私保护。利用智能合约自动完成对数据的匿名统计和排序,当某机构对排序结果存在异议时,可通过监管机构验证结果的正确性。

2 预备知识

2.1 保序加密

保序加密保证了密文与明文顺序的一致性,现多用于对云环境下的数据库数据机密性保护,可以高效处理涉及加密数据排序和范围查询。保序加密方案一般包含三个算法,记作一个三元组(GenKey,Enc,Dec),其明文空间设为D,密文空间设为R。

2.3 区块链概述

区块链是比特币的底层技术,具有匿名性、不可篡改、开放性等特点。区块链系统中每一个节点地位平等,不存在第三方的约束控制,两个互不信任的双方,无需第三方,可以直接点对点进行交易,且交易双方并无法获得对方的真实身份,很好的保护了用户的身份隐私。区块链是根据时间顺序将每个数据区块相连形成的链式结构,时间戳和链式结构的特性增加了链上数据被篡改的难度。区块链上数据是公开透明的,任何人都能够查看区块链上数据。

区块链的数据结构如图1所示。其中包含区块头和区块体两部分,区块头中有前一区块的哈希值、时间戳、随机数、Merkle树根等信息,每个区块都保存有前一区块的哈希值,从而实现向前链接形成链式结构,使得链上数据具有可追溯性。

区块链的发展历史可以分为三个阶段:区块链1.0、区块链2.0、区块链3.0。区块链1.0-可编辑货币是以比特币为代表的加密数字货币,相继出现一系列加密货币,如以太币(ETH)、瑞波币(XRP)、莱特币(LTC)、未来币(NXT)等。而数字货币大多用在转账、支付等方面。区块链2.0-可编程金融:单单的数字货币已经没法满足社会发展的需求,2013年12月,Vitalik Buterin发表“以太项目”白皮书[12],首次将近乎图灵完备的智能合约运用到区块链中,智能合约的提出使得区块链可以运用到除数字货币外的更多领域。区块链3.0-可编程社会:近年来,随着区块链技术的发展,区块链已被运用到各个行业(政府、文化、医疗、审计、物联网等),也在不断地改变着生活。

2.4 智能合约

2013年末,以太坊[12]平台首次将智能合约(Smart contract)运用到公有区块链上,任何人都可以去创建合约和去中心化应用。智能合约可以看成一段在区块链中自动执行的用户定义的程序。在以太坊中,智能合约在以太虚拟机(EVM)中执行,合约由多人共同部署,一旦部署成功,合约内容将无法修改,当满足某种条件时,合约会被激活自动执行,且不会受到人为的干预,最后将运行结果返回给用户。使用智能合约无法修改、自动执行的特性,可以用来代替可信第三方完成数据统计,确保统计结果的准确性。

智能合约的出现,极大的增加了区块链技术的应用领域。如果说区块链提供了一种可信的数据,那么区块链上的智能合约就提供了一种可信的计算。在金融应用中,智能合约可以自动处理付款交易过程,如针对保险业务,可以在某种情况下自动支付用户赔偿金,能够有效消除骗保等问题。在公证领域,智能合约利用区块链数据的不可篡改性,可对知识产权进行存在性证明。在物联网领域,智能合约的加入,可以自动执行复杂的多步骤流程,从而可以节省大量的成本与时间[13]。

3 基于区块链的可验证医疗数据统计方案

3.1系统模型

本文针对数据统计不透明,易篡改等问题,提出了一种基于区块链技术的可验证医疗数据统计方案。该方案中包括几个实体:授权机构CA、医院Hos、智能合约SC、监管机构SA。

授权机构CA:验证机构身份,并颁发认证证书以及密钥。

医院Hos:指拥有数据的链上机构。为了保护数据的隐私性,各医疗机构使用加密算法对数据进行加密处理后上传至区块链。

智能合约SC:链上智能合约对链上数据进行密文统计,在不泄露数据明文的情况下,对数据密文进行排序处理,并将排序结果公布上链。

[8] Boldyreva A, Chenette N, Lee Y, et al. Order-preserving symmetric encryption[C]. Annual International Conference on the Theory and Applications of Cryptographic Techniques, 2009: 224-241.

[9] Popa R A, Li F H, Zeldovich N. An ideal-security protocol for order-preserving encoding[C]. Proceedings of the 34th  IEEE Symposium on Security and Privacy(S&P), 2013: 463-477.

[10] Kerschbaum F. Frequency-hiding order-preserving encryption[C]. Proceedings of the 22nd ACM SIGSAC Conference on Computer and Communications Security, 2015: 656-667.

[11] Paillier P. Public-key cryptosystems based on composite degree residuosity classes[C]. International Conference on the Theory and Applications of Cryptographic Techniques(EUROCRYPT), 1999: 223-238.

[12] Ethereum White Paper. A next-generation smart contract and decentralized application platform[EB/OL]. https://github.com/ethereum/wiki/wiki/WhitePaper.

[13] Christidis K, Devetsikiotis M. Blockchains and Smart Contracts for the Internet of Things[J]. IEEE Access, 2016, 4: 2292-2303.

猜你喜欢

智能合约区块链
农产品供应链金融信用体系框架设计
基于区块链技术的去中心化数字出版平台研究
区块链技术在互联网保险行业的应用探讨
智能合约的特点及其在债券市场的应用
保险企业的区块链技术应用方向选择研究
区块链技术在金融领域的应用与前景研究
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
基于区块链技术的数字货币与传统货币辨析
区块链技术在会计中的应用展望