网络环境下中文信息全文检索系统的研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zhugege521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文就全文检索系统从以下几个方面进行了探讨:1、分析了全文检索的基本理论及技术.包括:四种检索模型:布尔逻辑模型、向量空间模型、概率模型以及概率推理网络;全文检索的几项关键技术;评价检索系统的主要指标.2、改进了现有的中文自动分词技术.该文在分析现有各种分词技术的基础上,提出了字典匹配为先,频度匹配为后的自动分词技术.3、提出了适合中文特点的索引结构和检索算法.全文数据库存贮量大,所以良好的索引对提高检索效率非常重要,对中文全文检索来说尤其如此.目前中文索引主要有二类:按字索引和按词索引.该文提出了一种字词结合的检索方法,与单纯按字和单纯按词的检索方法相比较,综合了两者的优点,查全率和查准率均有所提高,从而提高了检索效率.4、构造了一个基于向量空间模型的全文检索系统.首先设计了系统流程和各处理模块;并讨论了如何利用相关反馈改善系统检索性能的方法.文中给出了了CGI程序查询部分的具体实现.
其他文献
该文根据工程项目的特征,生命周期、目标及目标系统、系统性,围绕着工程项目综合计划这一主题展开了讨论;就中国国情介绍了目前国际上常用的项目计划工具和方法;针对大型工程
正当北国冰天雪地之时,云南省罗平县的80万亩油菜花近日成片绽放,散发出浓浓的春意。
通径分析方法过去多用于遗传育种分析及作物产量研究之中,近年来也有运用通径分析方法研究单一害虫对产量结构影响的报道.然而,在作物生长过程中,常常是多虫并存,复合危害。
供应链是由多个独立的经济实体组成的,他们在利益分配、风险承担等方面存在不同程度的冲突;供应链成员企业的利益经常与供应链整体利益不完全一致。这些都导致了供应链双重边际化现象,降低供应链整体和成员的收益。如何设计合理的供应链合同,适时调整订货量更准确地响应市场需求,提高供应链的效率以及合理地协调各成员的利益具有重要意义。本文将期权作为研究工具,以单个供应商和单个零售商组成的两级供应链系统为研究对象,建
近几年,我国的上市公司调控经营利润的事情时有发生,已经严重损害了股东及其他相关利益者。因此,本文通过对我国制造业上市公司的分析研究,来探究企业社会责任与盈利质量之间的相
Based on fault diagnosis and fault tolerant technologies, the mine-hoist active fault-tolerant control system (MAFCS) is presented with corresponding strategies
期刊
该文就企业战略和信息系统战略对应性问题进行了深入的研究.该文分析了企业战略和信息系统战略对应性的重要性,并结合前人的研究提出了信息系统战略对应性的定义.然后介绍了
该文有关格序偏好关系理论的研究将Von Neumann-Morgenstern理性行为公理中偏好关系的全序描述推广为格序描述,使得偏好结构的描述更为一般化,并且为弱化公理体系中完全性或