论文部分内容阅读
随着当今数据的爆炸性增长和数据的重要性不断增加,数据快速准确存储的要求越来越高。传统的集中式的存储硬件设备已经不能满足数据中心的存储要求,因此分布式的网络存储硬件设备被广泛应用,但由于数据存储在各个物理位置不同的存储节点上,存储工作需要大量的调度和部署优化。另一方面,现有的存储局域网协议iSCSI(Internet Small Computer System Interface)在实际应用中通常需要使用较为昂贵的专业硬件性能要求,导致预算和维护成本高。因此,设计一种基于分布式体系结构的存储局域网优化具有十分重要的意义。目前,软件定义存储被公认为是存储技术新的发展方向。所谓软件定义存储就是将硬件驱动从存储技术中抽取出来,转而用软件驱动的技术,它将与存储相关的控制工作都放置在相对于物理存储硬件的外部软件中。本论文基于目前高性能通用计算、存储和网络技术的发展,设计一种针对iSCSI的分布式的软件定义存储局域网模型(iSCSI-Distributed Software Defined Storage Area Network,iSCSI-DSDSAN)替代由原来集中式、依靠特定硬件来提高存储性能的传统架构,并进行了数据在分布式存储系统上的优化部署和iSCSI存储局域网访问性能优化。本论文首先着重研究了iSCSI协议的工作原理,参数意义,设计了一系列实验来研究不同iSCSI模式和参数对读写性能的影响,找出iSCSI读写的性能最优参数表。然后设计了iSCSI-DSDSAN的体系结构和组成模块。提出了一种基于遗传算法的分布式存储部署模型,它在数据部署时对数据存储位置进行优化。利用Matlab仿真,对比它和随机式和启发式部署模型,验证其调度的高效性。同时提出了iSCSI读写性能优化流程,它在读写数据时对读写性能进行优化。在Ubuntu系统下,采用java和shell编程对其进行了实现。实验结果分析表明,基于遗传算法的分布式存储部署模型将访问延时和迁移成本总体降低了15%。同时iSCSI-DSDSAN性能在存储访问尤其是写操作上具有显著提高,写带宽平均提高36%。