网页采集相关论文
在全球互联网资源急剧膨胀的情况下,搜索引擎技术为人们查找所需资料提供了一个良好的接口。然而,面对通用搜索引擎的信息量大、查......
VCE Search Engine是一个基于Globus网格平台的网络搜索引擎项目。本文以VCE Search Engine项目的网页采集功能为需求,设计并实现......
本课题首先对Web文本挖掘关键技术进行了深入的研究,讨论了网页采集、分词、词频统计和特征权值计算等文本预处理的相关技术。然后......
互联网的迅速发展导致网上信息飞速增长,使得信息搜索变得非常困难。当前的搜索引擎在查找时仅仅采用机械的关键词匹配来实现,缺乏知......
介绍基于内容评价的、基于链接结构评价的和基于巩固学习的三种采集算法的优缺点;介绍一种依据词典构建主题Ontology的方法,该方法......

