论文部分内容阅读
在个人计算机普及的今天,个人计算机成为人们处理个人信息的主要工具。随着个人计算机中硬盘容量越来越大,如何有效地检索个人计算机中的信息成为我们面临的挑战。本文针对桌面搜索中的索引技术,主要在以下几个方面开展了研究工作:
1)全文索引技术是构建桌面搜索的基础,我们对建立倒排索引过程中使用的中文分词技术、倒排索引的构建算法以及内存的使用等进行了介绍,并作了相关的性能测试。通过测试表明基于双数组静态词典的索引能大大提高索引和检索性能。同时针对桌面搜索对动态索引更新要求比较高的特点,对动态索引技术做了详细的分析。
2)桌面搜索和个人计算机的桌面技术的发展紧密相关。本文对个人信息管理和语义桌面的相关技术进行了初步探讨。语义桌面是利用语义网中的技术来整合个人计算机中的信息资源,本文简单介绍了如何构建基于语义桌面的桌面搜索。
3)实现了一个桌面搜索系统的原型,针对桌面动态应用环境,开发了一个动态监控文件系统的模块,实现了索引的自动更新。