基于P2P的资源搜索方法研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:xy_zhuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着存储空间的增大和存储价格的下降,即使是一个较小的P2P用户群也会共享大量的数据。大量的共享资源使得P2P系统吸引了大量的用户,但困难的是如何在大量的共享资源中寻找用户想要的资源。 本文在分布式散列表(DHT)思想的基础上,设计并实现了一个基于元数据的对等信息系统MPIS。由于网络资源具有多样性和复杂性,为了准确表述用户对资源的要求,也为了使系统返回给用户的结果能更好的满足用户需求,需要用多个属性从不同角度描述资源,从而构成这个资源的元数据。利用DHT可以将单个键映射到网络中的节点的特点,在发布资源时,MPIS将资源的各个属性对应的倒排索引发布到特定的节点;在搜索资源时,用户根据实际需要指定一个或多个资源属性值作为搜索条件,MPIS根据用户指定的各个属性搜索条件将搜索请求路由到存放各个属性倒排索引的节点,并将多个属性值对应的倒排索引求交集以使得结果满足用户的所有条件。我们在Linux环境下,利用Tapestry的DHT模块,采用Java语言,实现了一类比较典型的带有元数据的资源(MP3音乐文件)的发布和搜索。对于搜索时经常一起使用的属性,我们使用组合属性的方法进行发布和搜索,从而减少了倒排索引传递时的网络传输和求交集时的CPU周期。考虑到属性的同义性和近义性,我们在系统中建立常用的近义词库来扩展搜索的范围。另外我们使用虚节点的方法模拟大量节点来检验我们的系统,并且这种方法在一定程度也可以起到负载平衡的作用。 论文首先介绍了P2P的概念,研究了现有的各种P2P模型的搜索方法,并分析了各自的优缺点;接着研究了如何基于Tapestry构建P2P应用系统;随后详细叙述了MPIS的设计方案和实现方法;最后实验性地使用MPIS发布和搜索一些资源,分析MPIS的效率以及其他一些相关问题,展现了MPIS的实用性。
其他文献
近年来随着Internet的飞速发展,Web资源以指数级的速度增长,到2004年初,网页数量大约达到80亿。目前搜索Web资源的形式多种多样,使用最广泛的是搜索引擎,但当前的搜索引擎检索信息
Nowadays with the development of network transmit technology, Data rates are increasing, Protocols are becoming more dynamic and also being introduced more rapi
本文主要介绍了在Windows环境下,针对EXCHANGE邮件服务器和OUTLOOK的垃圾邮件检测系统的设计模型和实现方法。该检测系统不仅能够对已发现的典型垃圾邮件进行识别判断,而且也
社会网络的快速发展和普及,吸引了各个研究领域的科研人员从事社会网络的分析和研究,并在进行社会网络分析过程中提出并解决了很多具有重要应用与研究价值的问题。然而,社会
无线局域网的发展使人们能够更方便、快捷、灵活地访问网络,随着无线局域网的迅速发展,以及在社会生活中的应用越来越广泛,无线局域网的缺点也逐渐显现出来。由于无线局域网是通
  智能代理利用自身的智能性,不但可以自主的检测到网络故障,还可根据“经验”(自动更新数据库,进行自学习),处理一些故障,将结果保存,以备它回到管理工作站时,将结果带回;如果检测
本文深入分析了IP网络多播安全问题,归纳出IP网络多播安全威胁的特点,目前IP网络针对多播技术缺乏有效的保护和控制。然后介绍利用IP多播发起的拒绝服务攻击,并对现有的解决方
  本文研究了服务器集群系统中的一些关键技术,并针对数字图书馆服务请求中对服务器资源与网络带宽耗用比较大的特点,以负载平衡算法中较优的加权最小连接数调度算法为原型,设
  由于网络的开放性和不可信任性,移动代理系统面临的种种安全问题已成为移动代理走向广泛应用的瓶颈。其中,恶意主机或执行平台对执行代理的攻击最为广泛亦最难防御。为了解
二十世纪八十年代以来,人们开始借助大规模计算机来求解各类复杂问题。在科学、工程和商业计算领域,还有很多问题难以用现有的超级计算机解决,如需要处理的海量数据资源分布