一种面向海量小文件的文件接收和存储优化方案

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：woyaodeaihaiyao

【摘要】

：

HDFS是目前最典型的云存储平台,它凭借其高容错、可伸缩和廉价存储的优点支持大规模数据集的存储.但是HDFS对于海量、高并发、连续、高速的小文件的接收和存储效率并不高.针

【作者】

：

张守利杨冬菊韩燕波

【机构】

：

山东科技大学信息科学与工程学院,北方工业大学云计算研究中心,

【出处】

：

小型微型计算机系统

【发表日期】

：

2015年08期

【关键词】

：

HDFS 海量小文件 RSMSF 阈值一致性哈希

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

HDFS是目前最典型的云存储平台,它凭借其高容错、可伸缩和廉价存储的优点支持大规模数据集的存储.但是HDFS对于海量、高并发、连续、高速的小文件的接收和存储效率并不高.针对这一问题,提出一种优化方案RSMSF.在该方法中,文件缓存服务器不断地接收前端文件,给文件添加标识信息并存放到对应的文件队列.当文件队列满足某一窗口阈值时,根据一致性哈希算法将该队列中的文件发送到对应的文件处理服务器上进行文件合并处理,最后上传到HDFS.实验表明,RSMSF方法减少了文件的处理时间,降低了文件丢失率,同时降低了HDFS中内存的开销,节约了存储空间. HDFS is by far the most typical cloud storage platform that supports the storage of large datasets with the benefits of high fault tolerance, scalability, and cheap storage, but HDFS’s ability to receive and store large, high-concurrency, continuous, high-speed small files Is not high.Aiming at this problem, an optimization scheme RSMSF is proposed.In this method, the file cache server continuously receives the front-end file, adds the identification information to the file and stores it in the corresponding file queue.When the file queue satisfies a certain window Threshold, the file in the queue is sent to the corresponding file processing server for file merging according to a consistent hashing algorithm, and finally the file is uploaded to HDFS.The experiment shows that the RSMSF method reduces the processing time of the file and reduces the file loss rate , While reducing the HDFS memory overhead, saving storage space.

其他文献

地铁车站装修设计管理研究

随着社会经济的快速发展,人们生活水平的不断提升,大家对于出行环境有了更高的要求,不仅要求交通工程具有很好的实用性和便利性,同时还要求其具有一定的美观性和经济性。现如

期刊

地铁车站装修设计管理研究

从8848的高度起步——从8848网站销售业绩分析看中国电子商务机遇

以世界最高峰珠穆朗玛峰的海拔高度作为域名的8848网站(http://www.8848.net)自1999年3月18日试运行以来,在业界和公众中已引起越来越多的关注。在域名选择的浓厚民族情结之

期刊

中国电子商务业绩分析电子商务市场网站网上销售消费需求在线珠穆朗玛峰接受能力海拔高度

博通：释放云计算威力

在今天的数据中心、服务提供商和企业网络中,流量正在以异乎寻常的速度增长。这主要是因为更多基于浏览器的用户设备的面市刺激了数据业务的使用,同时在互联网数据中心运行的

期刊

计算互联网数据中心威力服务提供商企业网络数据业务用户设备企业数据

更高更快更强—一SGI首席科技长官Forest Baskett谈高性能、可视化计算

3月12日,SGI公司首席科技长官(CTO)兼主管研发的高级副总裁Forest Baskett来京。Baskett先生是工作站体系结构领域的专家,曾任DEC公司实验型RISC处理器Titan项目的设计师,198

期刊

可视化计算高性能计算机计算机体系结构超级计算机工作站数据挖掘缓存一致性协议处理器虚拟现实技术并行处理

技术创新与区域产业结构优化的实证研究

随着技术创新理论研究的发展,学术界普遍认可技术创新对于促进产业结构优化的重要作用。本文首先阐述了低碳经济下产业结构优化的内涵,指出产业结构优化是建立在技术创新之上

期刊

技术创新区域产业结构优化

多重理论视角下《黑暗的心脏》的解读

本文将吸纳心理分析批评、女性主义批评、种族主义批评和叙事学研究的理论成果,多视角地对《黑暗的心脏》进行不同的解读,以此展示同一个经典文本可以在不同的理论视角下得到

期刊

约瑟夫·康拉德《黑暗的心脏》心理分析批评女性主义批评种族主义批评

锐行服务全程助力湖南联通获高度服务评价

在电信行业,IT系统的安全性和可靠性尤为重要。如何利用及时有效的维保服务确保IT系统平稳运行,从而为用户提供更好的服务,是各运营商高度关注的问题。作为国内领先的IT基础

期刊

服务提供商评价联通湖南IT基础设施IT系统电信行业平稳运行

和黄选择中兴通讯在北欧建设LTE双模商用网

3月29日，中兴通讯宣布，公司已于近日与和记黄埔旗下Hi3G签署一项LTEFDD／TDD建设协议，全球首个大规模商用的LTEFDD／TDD网络落足北欧高端市场。根据合同约定，中兴通讯将在瑞典和丹麦

期刊

商用网络中兴通讯双模北欧LTE数据吞吐量TDD和记黄埔

电信运营商遭遇数据中心带来的危机和转机

Ovum研究显示，如果电信运营商要跟独立的数据中心经营者的强大产品一决高下，其数据中心策略需要作出重大的改变

期刊

电信运营商数据中心经营者

基于振动特性的码垛机器人结构优化

以设计的四自由度高速重载码垛机器人为研究对象,基于有限元建模法与AYSYS软件建立了其柔体动力学模型,对其末端振动进行了分析与求解。对码垛机器人进行模态分析,分析机器人

期刊

高速重载码垛机器人振动特性尺寸优化

一种面向海量小文件的文件接收和存储优化方案

其他学术论文