桌面搜索中索引技术的分析与实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:yangjunshisb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在个人计算机普及的今天,个人计算机成为人们处理个人信息的主要工具。随着个人计算机中硬盘容量越来越大,如何有效地检索个人计算机中的信息成为我们面临的挑战。本文针对桌面搜索中的索引技术,主要在以下几个方面开展了研究工作:   1)全文索引技术是构建桌面搜索的基础,我们对建立倒排索引过程中使用的中文分词技术、倒排索引的构建算法以及内存的使用等进行了介绍,并作了相关的性能测试。通过测试表明基于双数组静态词典的索引能大大提高索引和检索性能。同时针对桌面搜索对动态索引更新要求比较高的特点,对动态索引技术做了详细的分析。   2)桌面搜索和个人计算机的桌面技术的发展紧密相关。本文对个人信息管理和语义桌面的相关技术进行了初步探讨。语义桌面是利用语义网中的技术来整合个人计算机中的信息资源,本文简单介绍了如何构建基于语义桌面的桌面搜索。   3)实现了一个桌面搜索系统的原型,针对桌面动态应用环境,开发了一个动态监控文件系统的模块,实现了索引的自动更新。
其他文献
基于GPRS的远程噪音监测系统是公用无线传输系统在噪声监测领域的应用。远程噪声监测的目标是实现噪声在线自动实时监测和无线传输。目前我国噪声监测还具有瞬时性、空间分布
科学、社会的飞速发展对高性能计算(HPC)提出了更高、更全面的性能要求,刀片式服务器是为满足现代高性能计算应用需求而诞生的新兴机群系统,它具有高密集性、高可用性、高可扩
为了应对千万亿次(Petascale)高性能计算的挑战,国家智能计算机研究开发中心提出了一种新型的体系结构——超并行处理(Hyper Parallel Processing,HPP)体系结构。在HPP体系结构
随着网络的普及和各类设备的智能化、移动化,普遍互联和动态移动构成了当前计算环境的主要特征。服务发现协议帮助用户在各类分布式环境下找到所需的服务,即,存在于网络中,可以被
随着互联网的不断发展,网络文本信息资源正在急剧增加,如何利用计算机自动有效地对海量的文本信息进行管理和查询成为了当前的迫切需求。而文本分类技术提供了一种对自然语言文
纹理合成是目前计算机图形学、计算机视觉和图像处理等多个研究领域中的热点问题。它源自真实感造型中的纹理映射问题,随着其内涵和形式的不断演变,逐渐成为一个应用广泛的多学
数据流是为解决数字信号处理领域应用程序设计、开发难度大等问题而提出的,和传统的控制流相比,数据流能够更加自然地描述信号处理系统,更加清晰地表达系统的并发性。应用数据流
随着互联网技术的发展以及社会分工的不断细化,越来越多的组织为了共同的目标联合起来协同工作。这种动态协同环境给授权管理提出新的挑战。基于角色的访问控制适用于大型组织
本文以智能协同决策技术为研究对象,在基于主体的决策单元设计、决策单元协同问题求解、智能决策推理,以及协同决策支持系统框架设计等问题的研究上做了一些尝试。本文主要的研
随着计算机和通信系统的广泛普及和应用,信息社会对各种安全机制和服务的需求也日益迫切.与之相伴,信息安全尤其是密码学领域也正经历快速的发展,各种安全标准和基础设施正在广