论文部分内容阅读
随着云计算技术的迅猛发展,越来越多的企业和个人青睐使用私有云和公有云结合的产物-混合云存储大量数据。此外,为了保护数据的私密性,数据在外包之前必须进行加密,对加密数据进行直接检索是一个挑战。本文首先提出了一种在混合云中对加密数据进行隐私保护的多关键字Top-k密文搜索方案。表示为MTSE-HC。该方案具体通过基于二分k-means聚类的关键词分区算法将文档的关键词词典聚类为较平衡的关键词分区。然后根据分区,对文档向量和检索向量采用基于关键词分区生成的位向量作为索引。私有云通过基于关键字分区的位向量筛选出候选文档,然后公共云使用陷门来确定候选结果。在MTSE-HC方案的基础上,提出了一种增强方案EMRSE-HC,该方案增加了完全二叉剪枝树,以进一步提高搜索效率。此外,为了适用于大规模数据处理应用场景,我们利用Hadoop分布式平台、HDFS分布式文件存储系统和Map-Reduce计算框架提出了可并行实现的隐私保护多关键词Top-k密文检索方案PMTSE-HC。安全性分析和性能评估表明,面向混合云的隐私保护多关键字Top-k检索方案MTSE-HC和EMTSE-HC在检索效率方面均优于现有方案FMRS。在大规模数据应用背景下,PMTSE-HC方案的检索效率优于MTSE-HC。