基于hadoop云计算开源系统的分布式存储算法研究及实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:z992070002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各类移动终端的普及,对高带宽业务的需求也日趋明显,对互联网的数据传输能力也提出了更高的要求。提高网络传输效率的方法很多,但如何适当的降低文件的冗余度,提高文件的利用率,加快访问网络资源的速度然是一个开放性话题。hadoop是一个实现了谷歌云计算系统的开源系统,在分布式存储领域应用广泛。本论文的研究内容主要是基于hadoop系统,提出了一种新的低成本高效内容存储算法,工作内容主要包括以下几方面:  1.分析现阶段的网络存储技术包括网络文件系统、内容分发网络及对等网络等,并指出这些技术的优缺点;  2.研究hadoop文件系统特点和工作原理,提出了一种低成本、高效的分布式存储算法;  3.将本文提出的分布式存储算法与普通CDN-P2P存储方案进行成本比较,并进行时间复杂度和可用性分析;  4.利用map/reduce处理流程,任务调度机制对算法进行优化,进行仿真实验,与没有经过优化的算法进行性能对比。  基本论文的创新点在于提出了一种低成本、高效的分布式存储算法,根据文件访问和更新频率合理的实现文件存储分布,并基于map/reduce软件框架对算法进行了优化。该算法适当的降低了文件冗余度,有效的降低了存储网络的传输和存储成本。
其他文献
人脸识别是生物特征识别领域的一大研究热点。人脸识别技术具有自然性与不易被觉察等优点,因而受到人们的普遍欢迎,在国家安全、军事、公共安全等领域都有着广泛的应用前景。随
需求工程是软件开发中的一个重要阶段。作为需求工程的开端,需求获取所输出制品的质量将直接影响需求工程甚至整个软件开发过程的实施质量。现有的需求工程方法和实践中,有两个
随着微电子技术、无线通信及网络技术的进步,无线传感器网络技术与应用得到快速发展,极大地影响和改变人们的生活方式和产业结构,其广泛的应用前景受到学术界和工业界的高度关注
作为一种结构化数据检索的重要工具,Distributed Hash Table(DHT)受到大规模分布式系统的广泛应用,比如分布式存储、即时通讯。近几年,随着分布式系统规模的日益增大和激烈的行
近年来,云计算作为一种新型的计算范型,发展越来越迅速,规模也越来越大。然而,人们对于云计算安全性方面的担忧也越来越成为阻碍云计算发展的主要障碍之一。云环境高度复杂和多变
隐写术是信息隐藏领域用来秘密传递消息的一种技术,嵌入效率更高的隐写算法具有更好的安全性,而矩阵嵌入是一种用来提高隐写算法嵌入效率的有效方法。在进行矩阵嵌入前,通信双方
文本是存储和交换信息的最自然的方式,但是,随着信息时代的高速发展,文本的数量呈指数级增长,因此,如何迅速的从海量文本中获取信息就成为了一个具有挑战性的问题。  文本分类技
随着Web2.0时代的到来,Web技术高速发展,网站渐渐由原本的静态文档发展成为具有各种强大功能的动态页面。互联网用户可以通过网站轻松的完成很多业务。然而由于大量的个人信
近几年,随着移动互联网的飞速发展,智能手机终端和移动操作系统都取得了长足的进步,智能手机终端遍地开花,移动操作系统如iOS,Android等都取得了巨大的成功,拥有大量的用户量。在移
动画电影逐渐成为银幕上一种被人们普遍接受的艺术娱乐形式,其画面往往包含多种不同风格的对象,卡通对象和水墨画相交融的场景更是经常出现,因此,如何有效地实现不同艺术风格