论文部分内容阅读
随着大规模存储系统的应用越来越广泛,复杂性随着信息资源的爆炸式增长而与日俱增,信息资源的远程共享也日渐重要。当前的趋势是将分布于广域范围的存储资源互联起来,使用网络存储虚拟化来屏蔽具体存储设备的物理细节,将系统中各种异构的存储设备映射为单一的存储映像,增强互操作性以达到对用户完全透明的目的,为管理员提供统一集中的存储管理功能。 但是如何协调各种异构存储设备和存储中间件形成整体,在不稳定的底层网络上达到高可用性,在相对较窄的带宽上提高数据访问的速率,在资源共享的同时保持一定程度的自治并在给予时获得期望回报,是非常值得研究的课题。本文围绕这些问题开展了一些有意义的研究工作。 本文首先构建了基于异构底层非对称虚拟化的卷管理系统SVVMS,作为研究的基础平台。它将原来用于单机和局域网环境的卷管理器扩展到广域网络上,将各种底层存储网络如SAN、NAS、JBOD等纳入框架,使用网络非对称虚拟化形成一个具有单一I/O空间的虚拟存储池供上层应用使用。将存储资源的元数据分开单独由存储资源信息服务器SRIS处理,和严格的分层所有权控制,使SVVMS能够具备比现有卷管理器更为广泛的适应性。 随后,在对分布式网络RAID进行分析研究的基础上,本文设计了一种基于广域网络的热度动态迁移多副本分片策略MCSP。它对RAID 5进行扩展,将数据分片分散存储在网络中的各节点,并针对不稳定的广域网络使用多副本,以获得期望的可用性。副本根据被访问的时空局部性和阈值在节点之间迁移,以达到在多副本改善效率和一致性维护增加开销之间的折中。实验表明,它能够很好地将副本数量约束在既满足期望的系统可用性又不为系统增加太多开销之间,使得数据的访问速率达到尽可能最优。 接着,本文研究了广域网络存储虚拟化形成的拓扑结构,指出现有简单层次模型的不足,提出了层次式存储网络拓扑模型HSNT用以发现网络拓扑并设计Fabric。在发现中,结合存储网络的实际特点提出IP路径合并算法,并进行拓扑结构规整。Fabric的设计是NP问题,本文采用Prufer编码生成随机拓扑,使用基于遗传的启发式算法求解拓扑最优解,并给出用于Fabric自动设计的模拟器。 在前面MCSP和HSNT的基础上,本文进一步提出层次式统一内存Cache管理策略HUMC,将协作式Cache的思想扩展到层次式广域存储网络上,将远程计算机的内存统一成系统的全局Cache,作为本地磁盘的Cache以存储数据副本,实验表明可以取得良好加速效果。在使用层次式读写令牌的派生机制保持Cache一致性的同时,达到了尽量将跨广域网络的流量变成本地存储网络域中内部流量的目的,使得大部分的数据访问无需在延迟大、带宽窄的WAN上耗费时间,实验表明可以有效改善对速率不匀的底层存储进行广域网络虚拟化所带来的响应时间不确定问题。