基于新型网络编码的分布式存储系统研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:solonxpl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代的来临带来了数据的爆炸式增长,也使得传统的数据存储方式遭遇了新的挑战:虽然网络带宽和磁盘容量快速增加,但成几何级增长的用户数和应用需求,使得传统的数据分布式存储方式无法胜任互联网时代的海量数据处理任务。   分布式存储网络中,存储节点间的通信状况直接影响整个网络的性能。而传统的存储方案,或只关注了存储节点的数据冗余状况,或只关注了数据可靠性问题,对网络负载不均,中心或热点节点压力过大造成的网络瓶颈问题涉及较少。我们亟需一种新的数据存储方案来应对日益大数据时代的海量存储任务。   近年来兴起的网络编码理论在均衡负载,保证数据可靠性上的优秀表现,使我们有理由认为,如果能够将网络编码理论引入分布式存储中,改善存储节点间的通信方式,那么将极大改善整个分布式存储网络的性能。然而,现有的网络编码研究主要成果是在理论层面,缺乏在实际工程中切实可行的具体网络编码实现技术。   针对以上问题,本文提出了一种新的应用于分布式存储的线性随机网络编码实用方法—HE码,构建随机近似等重码作为编码矩阵,编码参数灵活,编码过程仅需异或运算,编码后信息向量使原始信息均匀分布。随后提出了基于HE码的分布式存储系统方案,实验结果表明,基于HE码的线性随机网络编码方案在负载均衡,编译码速度,保证网络可靠性,稳定性和安全性上,都有优秀的表现。然后对HE码的应用范围做出进一步扩展,与云计算当前优秀的商业应用HDFS相结合,提出了基于HE码的HDFS改进方案,并从实验角度验证了HE码编码方案在云计算中应用的可行性。
其他文献
格密码系统由研究人员在96年提出。由于它自身的优良性质:能抵御量子攻击,格上算法且困难问题容易理解,引起了研究人员的广泛关注。研究人员成功的用格解决了全同态加密和签名
高频数据项的挖掘问题属于不确定数据流处理1范畴的算法问题。在该领域的算法研究主要用于数据库Iceberg Query、服务器DOS攻击监测、搜索引擎热门搜索统计和社交网络热门话
云计算通过虚拟化和聚合等技术将大量服务器的计算力和存储资源整合在一起,形成一个庞大的资源池,并以服务的形式将计算力和存储能力对外输出。为了保证云计算平台所提供服务的
作者在钻研计算机应用与控制技术、计算机网络与通讯原理及其现代微控制器技术的基础上,对新型、高档、高性能、高速度面向21世纪的嵌入式(Embedded)单片机进行了新的探索和
当前,承受精神压力的人越来越多,心理健康问题已成为人类面临的一项重大挑战。精神压力识别可以帮助人们及时采取有效措施,缓解精神压力,保护心理健康,具有十分重要的研究意义。过
系统虚拟化技术是当前学术界与产业界广泛研究与探讨的一项信息技术,由于其在资源管理、服务器整合、绿色节能、安全隔离等方面的优秀特性,在当前日益兴起的大型数据中心与云
随着社会信息化程度不断提升,各种形式的电子数据积累越来越多,且产生速度不断加快,传统的数据库系统难以快速高效地从这些超大规模的数据中挖掘有效信息。频繁项集挖掘是一个典
图像分割是图像处理中的重要研究课题,随着图像处理技术在生产和生活中的广泛应用,图像分割也受到人们越来越多的重视。它作为图像处理中的关键环节,决定着最终的处理质量。由于
Max-SAT问题是一个著名的约束满足问题,在理论研究和实际应用中都有重要的意义。局部搜索框架是一个非常有效的解决带权重的Max-SAT问题的框架,本文提出了一种新的启发式的变量
随着多线程库的日益普及和多核处理器的快速发展,多线程软件技术被越来越多的开发者所使用。而在多线程软件中,并发错误是最难以处理的错误之一,不仅因为线程的调度受到操作系统