基于对象的存储系统中元数据管理算法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:leave2009418
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对全球范围内迅猛增长的数据存储需求,基于对象的存储技术(OBS)应运而生,相对于NAS和SAN而言,基于对象的存储系统由于其可伸缩性、低成本、跨平台、易管理等特性,逐渐成为海量存储系统的一个最佳选择。如Google公司的GFS作为Google的核心技术,利用数以万计的普通商用服务器,为Google的各种服务提供了强大的数据存储能力;Cluster File System公司的Lustre,支持上千个存储节点,上万个客户端,PB级存储容量,100GB/s的传输带宽,为高性能计算提供了强有力的支持。   在基于对象的存储系统中,元数据(目录、文件大小、访问时间等信息)与数据存储相分离,文件数据保存在大量的对象存储服务器(OSD)中,元数据则由专门的元数据服务器处理。   元数据请求在文件系统中所占的比例高达50%-80%,随着文件存储规模从TB级别走向PB级别甚至EB级别,在GFS和Lustre中所使用的单一的元数据服务器设计所暴露的问题也越来越严重,如单点失效,性能瓶颈,可靠性差,文件系统规模受限等。   本文针对基于对象的存储系统中单一元数据服务器带来的问题,结合联想网盘的实际存储需求,设计实现了一个支持多元数据服务器的分布式文件系统,能够利用元数据服务器集群,避免元数据服务器成为系统单点,通过将文件系统的元数据请求分布到多个元数据服务器,提供更好的元数据处理性能,同时保证元数据的冗余。本文的主要挑战在于:   1)在元数据服务器集群中,如何合理的分布和备份元数据,能够提供较好的性能,较好的扩展性和稳定性。   2)如何均衡系统中所有元数据服务器的负载,在元数据迁移中,如何防止过度迁移导致系统抖动,以及在元数据迁移后及时地更新客户端缓存状态。   本文是为联想网盘下一代存储系统进行的预研项目,利用以上研究成果,我们已经实现了一个文件系统原型,相对于我们的原有系统,其元数据处理能力得到了很大的提高。
其他文献
著名数学家约翰·卡尔·弗里德里希·高斯曾说:“数学是科学之王.”随着课改的深入,对高中数学教学提出了更高的要求.其中高中数学概念学习作为教学的难点,长期困扰着广大学
《中国记者》今年第五期发表的《新闻舆论的倾斜》,颇有见地,给人不少启示,如果能减少、甚至 The “inclination of the media and public opinion” published by the “C
眼电(Electro-oculogram,EOG)伪迹是由眼球运动引起而混杂在脑电信号(Electroencephalography,EEG)中的一种干扰噪声。这种噪声伪迹能够影响脑部电位的变化,干扰实际脑电,尤
导数的主要作用是研究函数的单调性,利用导数可以判断函数的单调性,求函数的单调区间,求函数的极值,最值以及解决恒成立问题中参数的范围问题.下面通过一道常见的习题及其变
研究以单个SnO2 传感器为敏感元件对CO进行动态检测 ;讨论了SnO2 气体传感器动态检测方法的理论基础。结果表明 ,运用动态检测方法明显提高了SnO2 传感器对CO的选择性 ,动态
建构主义是融合皮亚杰、维果斯基等认知理论和美国上世纪60年代教改经验的基础上发展起来的,它摈弃了我国长期存在的“传授——接受”式的传统教学模式的弊端,构建了以“学生
建构观认为:“人的认识活动的本质是主体的主动建构的过程.”强调以学生为中心,认为学生是认知的主体,是知识意义的主动建构者,教师只对学生的意义建构起帮助和促进作用.那么
随着社会不断地进步与发展,人们正遇到很多亟待解决的复杂实际应用问题,有不少问题都是需要在庞大的搜索空间中寻找最优解或准最优解,若不能利用问题的固有知识来缩小搜索空间则
在处理器设计领域,功耗目前成为制约CPU性能提升的主要因素之一。处理器的功耗不仅制约着CPU的主频的进一步提高,而且很大程度上影响着芯片的封装、测试的成本以及系统可靠性。
近年来,随着计算机硬件技术和网络应用技术的发展,基于集中化计算的网络计算机/服务器计算模式得到了广泛应用,其客户端形式也从过去的字符界面哑终端发展到现代的图形化界面交