论文部分内容阅读
为了解决传统搜索引擎系统面临的众多问题,计算机科研人员和学者提出在P2P网络系统之上构建搜索引擎,通过P2P对等网络把分散在各地的计算机用户联系起来,整合各地计算机的运算能力、存储能力、网络传输能力和资源存储,从而以较低的软件和硬件代价构成优良的服务性能和庞大的资源。P2P网络搜索引擎系统的特点是每个网络节点都是一个独立的数据资源库,每个节点的地位是相同的和对等的,不存在中央服务节点,所有对等点相互协作来响应搜索请求。 当前的P2P网络系统搜索算法的搜索效率低、网络带宽消耗较大、传播消息冗余多及其不能模糊匹配搜索等缺点,为了提高搜索性能,本文对基于CLUSTERING的对等网络搜索算法进行了研究,给出了全新CLUSTERING概念定义:按节点对共享内容、资源需求、查询内容的相似性及其共享目的和属性进行划分的逻辑管理基本单位,由中心计算机节点所辖的逻辑拓扑区域中多个性能相对较弱、属性相似的计算机或者地域相近的计算机组成的一个闭集合。在逻辑区域内计算机用户节点相似度系数很高,并且域文件在很大程度上能够代表逻辑域内所提供的服务信息及文件类别。 本文的研究成果包括: (1)针对无结构P2P对等网络查询效率低的缺点,提出了无结构对等网络基于CLUSTERING的搜索算法机制。根据各个节点用户的访问历史数据获取用户的访问聚集倾向属性,并基于各个层次化的本体树模型,把具有相同聚簇倾向的节点形成联系紧密的聚簇域,各个聚簇域相连接,形成CLUSTERING网络。 (2)针对无结构对等网络搜索算法和基于CLUSTERING的无结构对等网络搜索算法机制进行了分析,找出了查询效率低下的不足之处,结合自适应K-means聚类算法聚类特征向量和择优相连和查询倾向衰减机制,提出了一种基于multidimensional-CLUSTERING域的P2P网络搜索算法机制。 (3)针对Chord网络系统中节点的异质性,对节点的能力进行了有效区分,分成普通节点和超级节点,提出了基于CLUSTERING分组的Chord改进网络系统。为了克服Chord网络的缺点,能够适应节点频繁加入和退出造成的网络高度动态性,同时又能够进行高效率的查询,CLUSTERING分组的Chord网络在拓扑结构上采取了两层,第一层是由超级节点组成的Chord网络,可以提供节点主题资源的发布和搜索功能;第二层是由普通节点构成的同主题资源CLUSTERING分组子网络,子网络连接到同主题资源的超级节点上。 (4)针对传统的P2P网络系统不能进行模糊匹配搜索的缺点,在P2P网络系统的文本查询方面引入了语义概念。给定一个检索关键字,我们可以在P2P网络系统中找到与词关键字语义相近的查询结果。并针对网络节点本身存在关注范围的特点,提出了一个基于CLUSTERING域的语义P2P网络系统。