中文搜索引擎系统的分析与研究

来源 :鞍山钢铁学院 辽宁科技大学 | 被引量 : 0次 | 上传用户:zhensa9d
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文介绍了网络搜索引擎的发展历史、目前现状,并对搜索引擎系统和检索系统的原理进行了研究和分析,并从查询处理和文献分类两个方面做了进一步的研究,提出了两种新的处理方法. 首先,作者从系统各个组成部分对搜索引擎系统的工作原理进行了详细的研究.分析了构成搜索引擎系统的各个组成部分的功能和实现方法. 其次,作者在对常用的搜索引擎系统中的用户查询处理和文献分类方法的分析过程中,结合实际应用情况,提出了两种提高系统工作效率的方法:用户查询的扩展和WEB文献的模糊分类.针对用户查询,作者基于向量空间模型,根据自然界类别体系指出特征项的层次结构,提出了基于类别体系的层次结构,将特征项进行层次存储.利用特征项所表示的概念范畴的不同,对用户原始查询进行进一步的扩展.文中详细介绍了用户查询扩展的方法,给出了查找某一特征项的下两层子特征项的算法.对于WEB文献的模糊分类,在对WEB文献分类的过程中,如何用一个空间向量最大限度的代表一个WEB文献非常重要.最后,作者在上述基础上,设计和实现了一个基于计算机领域的中文文献的搜索引擎系统.
其他文献
无线传感器网络主要用途为采集环境数据,如无线石油勘测网络、火灾预警监测网络、战场环境探测网络等。然而,由于无线传感器内部器件易于损坏,且长期工作在不可预知的环境中,
该文研究了ISTAG的“Scenarios for Ambient Intelligence in 2010”这一报告,目的是要对未来信息社会设计其网络通信结构模型进行分析和设计.在对脚本技术需求、未来技术发
基因表达式编程是一种以线性染色体为基因型同时采用表达式树作为表现型的演化计算方法。随着对基因表达式编程研究的不断深入,基因表达式编程在理论和应用研究领域都取得了很
本文在详细分析现有的矿井安全可视化研究现状的基础上,根据矿井的实际情况和需要,针对已有软件的不足,提出了开发矿井安全可视化交互系统的设想并加以实现。该系统采用组件化的
该论文跟踪了国外入侵检测研究的最新进展,针对现有的入侵检测系统在配置性、扩展性、灵活性上存在的缺陷,将来源于分布式人工智能领域的软件代理技术应用于入侵检测系统,从
目前,对象管理组织(ObjectManagementGroup,OMG)的公共对象请求代理结构(CommonObjectRequestBrokerArchitecture,CORBA)正在成为分布式对象技术的事实上的标准.为了推动CORA
该文的研究目标定位为:基于计算机支持协同工作的研究工作,结合新一代网络软件协作需求,研究相关的软件协作机制、软件协作系统的实现方法与机制,构造相关的原型系统,并应用
该文中作者们分别给出了这些处理的算法和流程及相庆的数据结构.针对研究过程中遇到的问题,作者们应用相关领域的研究成果基础上,提出了多个新的算法和判定规则:采用Chient/S
该文主要研究了如何根据给定的目标描述,进一步自动化、智能化地组合、集成和执行Web services以达到目标.该文采用的解决方案就是,让智能Agent自动地规划、集成和调用各种各
随着时代的发展和人们需求的不断提高,通信行业在过去的几十年里发生了翻天覆地的变化,尤其是移动通信的迅速发展,使用户彻底摆脱终端设备的束缚,实现了完整的个人移动性。进