论文部分内容阅读
随着网络技术的发展,互联网内容不断丰富,整个网络逐渐堆积成一个前所未有的超大型信息库。然而伴随信息量的膨胀,用户想找到所需的资料如同大海捞针。搜索引擎的出现在一定程度上解决了这个问题。搜索引擎(Search Engine)是一个信息处理系统,它以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。元搜索引擎(Meta Search Engine)是建立在已有的传统搜索引擎服务之上的一种搜索引擎。它的特点是本身没有存放网页信息的数据库,自身不采集文档,也没有索引,只是维护它所管理的搜索引擎的参数信息,如每个引擎的查询参数,引擎的内容表示,用户在提交递交检索请求后,元搜索引擎负责转换成其他搜索引擎能够接受的命令格式,提交给多个预先选定的独立搜索引擎,并将所有查询结果重新排序、比较和筛选后,以整体统一的格式呈现到用户面前。由于采用了一系列的优化运行机制,能够在尽可能短的时间内提供相对全面准确的信息,因此成为倍受推崇的检索首选入口。目前运营的元搜索引擎各具特色,功能各有侧重,完全“理想”的尚不多见。元搜索引擎主要存在如下几个问题:检索功能不完善、检索结果不理想、检索速度较缓慢、中文元搜索引擎与英文元搜索引擎相比还存在较大差距。本文首先对目前搜索引擎技术的发展历史和现状进行了回顾,其中介绍了搜索引擎的基本问题模型,传统搜索引擎的框架和一般分类。详细介绍了元搜索引擎的基本构成,并对各模块功能进行分析;并且介绍了元搜索引擎的分类:在与独立搜索引擎进行比较之后,给出了元搜索的几个性能判定指标。
由于元搜索引擎正处于发展阶段,其研究在如下几方面尚不充分:在专业搜索领域方面还存在一定的研究空间:搜索的可扩展性还需要改进,本文提出借助数据库和搜索资源的可扩展性以试图解决上述问题。针对元搜索引擎与专业领域相结合的问题,本系统借助各种类型的关键词库来对搜索资源分门别类,在借助模式匹配和关键词搜索来达到二次筛选的效果。针对搜索引擎资源的日益增多,本系统利用模化的设计可方便的添加和删除搜索资源。
以上述理论为指导基础,开发出了元搜索系统,该系统己在公共信息网络视音频监控系统和网中行网吧监控过滤软件和教育软件等2个项目中实际运行发挥出极大作用,为国家广播电影电视总局及其各省分局和国家公安机关规范互联网行为和网吧的规范管理作出一定贡献。