基于区块链的可验证医疗数据统计方案
摘 要:目前,数据统计广泛应用于社会经济生活的各个方面,对医疗数据进行统计已成为医院工作不可或缺的环节,然而传统的方法存在数据篡改、信息泄露的风险。文章基于区块链技术,提出了一种新型的医项检查数据等。这些记录通常会传送到医疗的云服务器中存储,这不仅给病历数据的统计带来便利,也节省了大量医生手写病历的时间。高效准确的医疗数据统计以及统计数据价值的有效流通,给医疗机构科学决策和科学管理提供了可靠的数据依据[3]。然而在统计过程中,一方面因大多数医院信息化技术人员水平不一,导致统计结果的正确性相差较大[4];另一方面各医院相互独立进行统计工作,存在数据易篡改问题,而且无法实现统计数据共享。因此,亟需改善现有统计方案,增强数据统计的正确性和可共享性。
比特币[5]市值的一路增长,其底层区块链技术也得到政府、企业和学术界高度的重视。我国也相继出台了许多关于区块链的发展政策。2016年,《关于印发“十三五”国家信息化规划的通知》[6]中,首次将区块链作为一项战略性前沿技术、颠覆性技术。2017年,国内多省份、直辖市均出台了针对区块链产业发展的相关指导意见和区块链专项扶持政策,加快了各地区块链的发展步伐。2018年10月8日,海南省工信厅正式授牌海南生态软件园设立“海南自贸区(港)区块链试验区”,该试验区是国内首个正式授牌的区块链试验区。 区块链作为一种新型分布式数据库存储技术,具有开放性、可追溯、不可篡改等特性,对于解决数据统计面临的数据易篡改、结果不准确等问题有着天然优势。然而链上数据具有高度透明性,为了保证链上数据的隐私性,有必要在数据上链前进行加密处理,且需要采用一定的技术完成对链上数据的匿名操作。
保序加密(Order Preserving Encryption,OPE)于2004年由Agrawal等人[7]首次提出,该加密方案使得密文与明文保持相同的顺序,可以实现在不透露任何明文信息的情况下,直接对密文进行查询操作,且达到与明文查询相同的效率,能够很好保护用户数据的隐私。保序加密分为一对一保序加密和一对多保序加密。前者指相同的明文加密得到相同的密文,后者指同一个明文可能得到不同的密文。Boldyreva等人[8]引入了保序明文不可区分的安全性定义(Indistinguishability under Ordered Chosen Plaintext Attack,IND-OCPA),并证明该保序加密密文是线性增长的,故不能够达到理想安全性的目的。后提出选择密文攻击下伪随机保序函数(Pseudorandom Order-Preserving Function under Chosen Ciphertext Attack, POPF-CCA),并提出相应的保序加密方案。Popa等人[9]提出一种新型的保序加密算法(mOPE),该方案实现了理想的IND-OCPA安全。Florian Kerschbaum[10]提出了一种隐藏频率的保序加密方案,通过随机化密文来隐藏明文的频率,在保证信息机密性的同时增强了密文安全性。
本文针对目前存在的数据统计中易篡改、易泄露等问题,提出了基于区块链技术的可验证数据统计方案,使用区块链降低第三方信任机构的约束,增强了数据透明性,同時很好的抵御了数据被篡改的可能。采用同态加密和保序加密实现对链上数据的隐私保护。利用智能合约自动完成对数据的匿名统计和排序,当某机构对排序结果存在异议时,可通过监管机构验证结果的正确性。
2 预备知识
保序加密
保序加密保证了密文与明文顺序的一致性,现多用于对云环境下的数据库数据机密性保护,可以高效处理涉及加密数据排序和范围查询。保序加密方案一般包含三个算法,记作一个三元组(GenKey,Enc,Dec),其明文空间设为D,密文空间设为R。
区块链概述
区块链是比特币的底层技术,具有匿名性、不可篡改、开放性等特点。区块链系统中每一个节点地位平等,不存在第三方的约束控制,两个互不信任的双方,无需第三方,可以直接点对点进行交易,且交易双方并无法获得对方的真实身份,很好的保护了用户的身份隐私。区块链是根据时间顺序将每个数据区块相连形成的链式结构,时间戳和链式结构的特性增加了链上数据被篡改的难度。区块链上数据是公开透明的,任何人都能够查看区块链上数据。
区块链的数据结构如图1所示。其中包含区块头和区块体两部分,区块头中有前一区块的哈希值、时间戳、随机数、Merkle树根等信息,每个区块都保存有前一区块的哈希值,从而实现向前链接形成链式结构,使得链上数据具有可追溯性。
区块链的发展历史可以分为三个阶段:、、区
基于区块链的可验证医疗数据统计方案 来自淘豆网m.daumloan.com转载请标明出处.