基于Linux文件系统变化通知机制的细粒度索引更新策略的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:SANDWICHSZHANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
索引更新是搜索引擎的关键技术之一。以往动态文档集合下的索引更新策略的研究主要针对文档的插入和删除。对于文档的插入,索引更新的基本思想就是首先对插入的文档建立内存索引,然后在内存溢出或达到某个阈值时根据相应的算法进行更新;对于文档的删除,则是当索引中的垃圾记录达到某个阈值时进行垃圾回收;对于文档的修改,只是简单地把其看成文档删除再插入的过程。   然而,对于桌面搜索而言,其文件系统中的文档集合是高度动态的,除了文档的插入和删除外,文档的修改操作也频繁发生。传统的针对文档修改的索引更新策略由于对整个文档重新构建索引,因此带来低效的索引更新性能。针对这些特点和弊端,进行细粒度的索引更新,即只对文档中改变的内容进行更新,就显得尤为重要。此外,要进行索引更新,桌面搜索的索引进程需要捕捉到文件系统中发生的变化。然而,现有典型的Linux文件系统变化通知机制由于存在诸多缺点不能满足桌面搜索细粒度索引更新的要求。   本文针对高度动态文档集合,特别是文档修改的索引更新问题来展开研究。取得的创新性成果主要包括以下几个方面:   1)深入分析了典型的Linux文件系统变化通知机制dnotify和inotify,对其实现和存在的不足分别进行了详细的论述,并进行了比较。   2)实现了一种支持细粒度索引更新的Linux文件系统变化通知机制nnotity,克服了典型通知机制的缺点,支持递归监控,并提供详细的文件系统事件信息。   3)在nnotify的基础上,提出了针对动态文档集合的索引更新策略,尤其对于文档的修改,进行了细粒度的索引更新。实验证明,该策略在保证查询性能的前提下,提高了索引更新的性能。  
其他文献
作为一种传统医学,中医学已有数千年的历史。在中医发展的几千年过程中,积累了很多治疗病症的方剂。方剂数目庞大,涉及的药物也非常多。如何利用这些海量信息为防治疾病提供科学
入侵检测是一种积极主动的安全防护技术,它可以监视主机系统或是网络上的用户活动,发现可能存在的入侵行为。但由于我国入侵检测技术研究起步较晚,目前入侵检测系统依然存在
无线传感器网络由部署在监测区域内的大量廉价的传感器节点组成,各个节点之间通过无线通信方式自组织形成网络系统,协作地进行感知、采集和处理周围环境或感知对象的信息,并
普通的分组检测仅仅检测分组的头部,深度分组检测(Deep Packet Inspection)有时也称为完全分组检测,属于应用语义级的检测。随着计算机网络的发展,网络的功能正逐步从简单的“浅层
存储系统逐渐成为网络服务器系统的主要瓶颈。为了提高存储系统性能,当前研究的明显趋势是通过对应用负载进行分析,针对访问特征对数据预取、缓存替换、数据分布等策略进行优化
在计算机视觉领域,手部姿态估计是通过传感器获得的视觉信息,估计出手部的结构姿态的方法。由于手部姿态估计在基于手势的人机交互、手语识别等领域有着潜在的广泛应用,近年来已
K-匿名方法是视图发布条件下防止数据隐私泄露的一种重要方法,K-匿名化后的视图称为K-匿名表。当基本表发生更新变化时,如何保持K-匿名表数据与基本表数据的一致性是一个值得
部分可观察马尔可夫决策过程(POMDPs)以其丰富而灵活的数学模型,被广泛应用于各种贯序决策问题,成为最近研究比较热的决策模型。但其维度和历史问题使得其精确求解的复杂度过高
近年来,随着Internet规模的增长,分布式组件技术快速发展,新的组件模型不断涌现,现有的组件模型也持续更新。组件容器为组件及组件应用提供部署和运行环境,是基于组件分布式应用开
随着无线网络技术的快速发展,基于无线局域网的多媒体应用也开始起步,如VoIP电话、网络视频、VOD服务等等。由于目前的无线局域网的实现基于传统的802.11协议,这使得在无线局域