论文部分内容阅读
目前,由于中国经济与社会整体信息化程度的日益提高,互联网和人工智能等技术的创新对中国医疗事业产生的革命性影响也越来越突出,并且越来越多的医疗数据资源以惊人的速度进行聚集,中国医疗行业也开始真正进入“大数据时代”。随着医疗大数据的广泛应用和发展,促进了我国当前医疗服务模式的变革、推动了当前医疗信息化的建设、普及了医疗电子病历(Electronic Medical Record,EMR)的使用。但是医院信息系统(Hospital Information System,HIS)和EMR的应用目前还处在初级阶段,还面临着许多问题,其中医疗信息泄漏是人们最为关注的问题之一,因为医疗信息包含很多患者隐私数据,如果数据泄漏可能会给患者带来巨大经济损失,甚至危及社会安定。访问控制作为保护信息安全的主要手段,能够有效保证用户合法地访问医疗数据,传统的访问控制模型的授权都是基于预定义的规则,难以满足动态访问控制需求,而且他们只是在身份验证的可靠性和合法性的基础上进行访问控制,并未对用户的访问过程进行监控。在本文中,我们从EMR数据隐私保护的实际问题出发,将风险理论与访问控制技术相结合,探寻最适合医疗领域隐私保护研究方法,为医疗大数据隐私安全问题的研究提供思路,本文的研究成果主要体现在以下几个方面:1.构建医生工作目标决策模型。该模型在医生选择工作目标阶段引入不确定概率犹豫模糊偏好关系(Uncertain Probability Hesitant Fuzzy Preference Relation,UPHFPR)决策方法,融合不同医生的决策意见,进一步确保医生选择最佳的工作目标,减少医生因选取工作目标不当造成患者隐私泄露风险。2.医生分类,基于医生历史访问数据使用谱聚类把医生聚成两类。首先对医生历史访问数据进行预处理,根据国际疾病分类(International Classification of Diseases,ICD)第10次修订本《疾病和有关健康问题的国际统计分类》,把医生历史访问数据转换成布尔矩阵,将布尔矩阵作为医生分类的输入,使用汉明距离和杰卡德距离相结合的算法度量医生之间的相似矩阵。3.医生访问行为的风险量化。在医生特定工作目标和类型确定的情况下,本文将工作目标和医生类型这两个参数引用到信息熵中,以此计算医生请求访问EMR的风险值,优化后的算法提高了医生访问行为风险量化的精准度。4.构建访问控制模型。通过访问控制函数对医生访问行为的风险值进行判断,并对医生的访问请求做出决策,以此控制医生对电子病历的过度访问,降低医生过度访问造成的隐私风险问题。