论文部分内容阅读
信息采集系统(俗称网络蜘蛛,web spider)是搜索引擎的一个重要组成部分,它是搜索引肇信息的来源.所以提高信息采集系统的效率,同时可以在一定程度上提高搜索引擎的查全率和查准率.基于本体的主题信息采集技术主要是为了使传统的网络信息采集系统具有语义处理的功能,不必要将所有信息都取出,能对信息进行挑选,来减少服务器容量的使用.