基于simhash的密文同义词检索方法

来源 :第八届中国可信计算与信息安全学术会议 | 被引量 : 0次 | 上传用户:youtodown1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在现有加密搜索方案的基础上,通过对明文同义词检索算法的研究,提出一个支持同义词检索的密文模糊检索方案。本文同时对simhash进行改进,使其适用于少数单词的环境,然后将改进的simhash引入到现有方案中,提高了现有方案的检索效率。为了解决现有的密文检索方案计算量过大,无法支持同义词检索等问题.通过对现有明文同义词检索方案和传统密文检索方案的研究,在安全KNN(K - Nearest Neighbour)方案的基础上提出一个支持同义词检索的密文模糊检索方法.通过改进的simhash算法提高了安全KNN方案的效率. 在本文中,为了解决支持同义词的模糊检索问题,例如使用“IEEE”来检索“Institute for Electrical and Electronic Engineers”相关的文档,提出一个基于同义词转换的模糊检索方案,在索引生成阶段,对关键词进行同义词转换,使在查询阶段能够检索到用户提交的查询关键词的同义词结果。使用ASPE方案对索引项和检索向量进行加密,以支持向量间的内积计算,但是ASP方案基于欧几里德空间,只能对长度相近的关键词进行匹配。为了能够使ASPE方案不受关键词长度的影响,在现有的文本simhash方案基础上提出一个针对较少关键字的simhash方案,使得ASPE方案不受关键词长度的影响,从而进一步实现基于同义词扩展的密文检索方案。从实验中可以看出,本文提出的方案虽然在效率上提高较大,但是相比于ASPE方案,在用户提交的关键词数量少于3个的时候,查询精确度较低。在以后的工作中,将进一步对支持关键词的simhash算法进行改进,使其能更好的表现关键词之间的相似度,提升查询的精确度,使用户在输入单个关键词的时候,也能将符合要求的结果在 集中在结果集合中的最前面。
其他文献
  Access control is a core security technology that has been widely used in computer systems and networks to protect sensitive information and critical resour
会议
Cajun P330产品系列具有自配置IP路由、策略管理能力、模块化灵活性、成本低、可堆叠等特性,它为堆叠式交换机赋予了新的含义。 此产品系列包括4个基础模块,它们可以提供24
阅读是人们获得各种信息最迅捷的途径之一,也是人们学习、工作、生活中获得信息从而进行思想交流的迅速有效的方法。所谓“读书破万卷,下笔如有神”,就说明了阅读的重要性。阅读教学是语文教学最重要的部分之一,是学生语言学习的重要形式,但学生还不能用自己的能力去真正了解和学习课文的语言,这一直是教学中的大问题。如何尽快地使学生掌握良好的阅读方法、提高阅读效果呢?下面谈谈笔者对小学语文阅读教学的一点看法:  一
子宫内膜癌是常见的妇科恶性肿瘤,多数发生在绝经后女性。传统治疗方法切除了全子宫及双附件,使患者丧失生育功能。目前,文献报道了较多关于子宫内膜癌保守治疗成功的案例,使
在不安全信道通信的人,为了密钥的安全,密码设计者有时需要将一个主密钥分成一些子密钥秘密地发送给若干参与者,使得这些参与者中的某些人汇集他们所拥有的子密钥时,他们就有可能
会议
随着我国科技进步和人民生活水平的不断提高,电能在人们的日常生活中发挥着越来越大的作用,保障电力系统的稳定运行,是保证人们正常生活和生产的关键.近年来,随着工业的逐步
  With the wide use of cloud computing,the lack of a trustworthy infrastructure in clouds has been a barrier for the sustaining deployment of cloud platforms.
会议
目的 对不同的物理康复治疗在颈肩腰腿痛的临床上具备的应用价值.方法 对2020年1月至6月于我院行康复治疗的120例颈肩腰腿痛患者的临床资料进行回顾性分析,对其进行数字化的
面对高维度的特征集和大规模的样本集,隐写分析技术对分类器的要求越来越高.本文在集成分类器的基础上提出了一种面向通用隐写分析的选择性集成分类器.首先基于随机森林生成
鲁扎拉是一个不起眼的意大利小镇,由于偶然的机缘和巧合它先后进入了两位摄影大师的视线,从此这里成为了远近闻名的地方。 Ruzhala is a humble Italian town, by chance an