论文部分内容阅读
随着因特网的迅速发展,网络中的信息资源快速增长。搜索引擎己成为人们获取信息的必要途径和重要手段。国内外许多研究机构已经对搜索引擎技术开展了大量的研究工作。目前,搜索引擎主要采用基于关键词的匹配搜索技术,存在如下一些不足之处:返回大量的结果页面,但用户难以快速找到满足需要的信息;搜索结果缺乏有效的信息分类;搜索策略缺乏对关键词的理解,仍属于纯关键词匹配层次上的搜索模式。
本体论(Ontology)作为一门重要的新兴学科,现已成为知识工程、自然语言处理、信息系统、智能系统集成和知识管理等多个领域的热门研究方向。它为人们及广泛异构的应用系统提供共同的领域知识理解,并为语义网(Semantic Web)中基于内容的知识获取、互用和交流提供高质量的保证。
本文的主要研究工作就是将领域本体应用于搜索技术中,构建一个基于领域本体的语义化搜索引擎。目的是为了实现基于领域本体的语义化搜索,从而能够为用户提供更全面、更专业、更符合用户需求的搜索结果。
首先,本文介绍了搜索引擎的产生背景、组成和分类,分析了当前搜索引擎存在的问题,并提出了本文基于领域本体的语义化搜索引擎;介绍了本体的基本理论和本体开发工具。
其次,本文提出了语义化搜索引擎的系统功能和实现原理,提出了语义化搜索引擎的系统架构,并对计算机科学领域本体进行了结构设计,利用本体开发工具对其形式化。
再次,本文深入地研究了语义标注和语义扩展推理。采用XML技术作为资源表达方式,提出了生成XML资源库的转换机制,实现了有效的搜索资源。提出了XML资源的语义标注策略,给出了XML语义资源库的生成原理,实现了XML资源的语义化。提出了基于领域本体的语义扩展推理模型和算法,实现了语义扩展推理查询和语义扩展搜索。
最后,描述了语义化搜索引擎的组成。详细地介绍了全文搜索引擎子系统、语义搜索引擎子系统和语义扩展搜索子系统的实现过程,并分析和比较了三类搜索引擎子系统的搜索效果。