基于全文数据库搜索引擎的研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:sunshixi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Inernet的出现改变了人们获取信息的方式,使人们足不出户就可以得到世界上任何一个角落的信息.但是随着Internet上信息数量的指数性增长,使得通过浏览各个站点来获取信息的方法,变得越来越不现实,因此人们自然而然的转向使用搜索引擎来帮助人他们获取自己所需要的信息.该文从技术的角度出发,具体实现了一个基于全文数据库的搜索引擎模型,并对搜索引擎技术进行了深入探讨.该文第一章对搜索引擎的基本概念和它与Internet的关系做了简单的介绍;第二章是全文的重点,对机器人(即搜索引擎的信息抓取部分)实现技术做了详尽的讨论,包括信息抓取、信息加工、数据更新,以及错误处理;第三章讨论了搜索引擎的其它两个部分--建库与服务,并以TRIP系统为例,重点描述了全文数据库的特点和它在搜索引擎技术中的重要地位;最后一章对于搜索引擎存在的一些技术总是和发展趋势做出了更深一步的探讨.
其他文献
学位
该文紧紧围绕"信息资源共享"这一网络建设的基本目的,分四大部分来研究广东金融信息网络的建设.论文第一部分首先指出建设金融信息网络的必然性,并介绍了发达国家金融信息网
中图分类号:G806 文献标识:A 文章编号:1009-9328(2016)04-000-01  摘 要 对老年人参加体育锻炼的方式、存在的问题和影响老年人参加体育锻炼的因素进行了探讨。研究表明:我国老年人参加体育锻炼的方法多数存在缺陷,包括老年人参加体育锻炼方法的选择,体育锻炼时间的安排方面,另外影响老年人参加体育锻炼的因素呈现多样化,阻碍了老年人参加体育锻炼的积极性。  关键词 老年人 体育锻
科研机构是当今社会科技创新的主导力量,科研机构是典型的知识密集型组织,是典型的知识创新型组织,科研机构的本质任务是进行知识创新,核心主体是科研人才,科研机构中科研人才和科
该论文首先分析了中国Internet和ISP的发展状况、存在的问题;之后分析了问题产生的原因;最后,在此基础上提出了解决问题的建议及对策,主要包括:强化政府在Internet以及ISP发
学位
可供选择的商品看起来越相似,消费者的选择难度就越低。实验发现,让商品看起来相似度更高,反而首先是让消费者注意到它们之间“微不足道”的差异。  商家似乎是为了体谅我们,会将不同套餐的价格统一到相同价格,比如鸡肉汉堡、牛肉汉堡和烤鸡翅的套餐统统都是15元。快餐店老板也许是认为,这样可以使顾客更快速地作出购买决定。然而,当我面对两组价格完全相同的汉堡包套餐时,反而更加困惑,因为我需要苦思冥想,对比两个套
在探讨人工智能影响和意义的基础上,梳理当代设计的形式和思维,明确当代设计创新的本质和方式.从人工智能时代设计的呈现面貌、表达方式、思维结构及价值规范等方面来分析设
该文正是利用相对有利的条件,根据文献计量学的基本理论和方法,对中国精密仪器行业的著者分布、引文特征、文献增长和文献老化规律进行了定量研究,提供必要的基本数据和分析
本文论述了音像制品知识产权保护问题及其相应对策。首先明确界定了音像制品知识产权的概念、具体内容和主要特征,接着对音像产品的厂商均衡和版权不受保护时的音像产品市场进
中国石油综合信息系统是在经济信息系统和石油企业信息系统基础上建设与发展起来的,论文阐述了中国石油综合信息系统建设的总目标、特征、职能和作用.中国石油综合信息系统的