论文部分内容阅读
内网跨域信息资源共享有着极其严格的安全要求,传统的搜索引擎并不能满足其安全特性要求,这就对搜索引擎技术提出了更高的要求。面对政府和企业内网中海量异构的信息资源,如何帮助用户快速找到他们所需要的信息,同时实现有效的访问控制,如何适应内网信息资源共享安全要求,构建内网搜索引擎,为内网用户提供基于权限的统一的安全的信息检索服务,搜索引擎属于信息共享范畴,而访问控制是信息安全保护领域内容,二者是一个对立的,如何在信息共享中又实现信息保护是研制访问控制内网搜索引擎的目标。 互联网上的信息大多在网页上,而在内网中,信息资源分散在web页、数据库、目录文件等,用户需求变得更加多样和具体。内网搜索的重点是各种结构化和非结构化的数据的安全的全方位的搜索。内部网搜索引擎必须能够实现安全性,用户只能搜索到与其权限对应的信息资源。本文的主要研究工作有以下几个方面: 1.研究了内网搜索引擎发展现状,介绍了搜索引擎四个主要功能模块:采集,索引,检索,展示,对比互联网搜索引擎,给出了内网搜索在功能和性能上的需求。 2.对常见的访问控制模型进行重点介绍,提出了基于属性的访问控制模型在分布式内网搜索中的应用,分析了分布式部署搜索引擎优点和基于属性的访问控制模型优点,基于属性的访问控制模型保证了安全的内网搜索,很好的适用于对权限要求较高的复杂内网。 3.分析了属性管理技术和利用XACML语言实现基于属性的访问控制模型,并提出了内网搜索中属性匹配算法和XACML中策略规则的优化算法,提高了访问控制效率。 4.改进了内网搜索排序算法,结合考虑了文档密级属性,提高了内网搜索查准率。 5.结合总体设计思路和构架,给出了搜索引擎各模块的具体实现。实验结果显示,使用上述方法实现的系统满足内网搜索的要求。