论文部分内容阅读
随着大数据时代的到来,数据呈爆炸式增长,传统的存储结构已经不能满足数据存储的要求,此时云存储便应运而生,云存储由云计算衍生而来,是指通过分布式、虚拟化、智能配置等技术实现海量、可扩展、低成本消耗的存储系统,并提供给用户存储数据的接口,提供按需服务的应用模式。云存储使得用户可以在有网络连接的条件下随时取用数据,但是当用户将数据交给云存储服务商(CSP: Cloud Storage Providers)时就失去了对数据的控制,因此不得不考虑数据的安全问题。数据安全主要包括数据机密性、数据完整性、数据可用性这三个方面。传统解决数据机密性依赖各种加密算法;解决数据完整性则主要采用公开审计方案;解决数据可用性大多采用冗余策略,冗余策略主要包括备份和编码。但是传统解决数据安全的方案存在一些问题:1、加密算法和公开审计均有很大的算法复杂度,因此会带来巨大的计算消耗,对于计算能力有限并且存储数据量巨大的用户来说,这种计算开销可能是无法承担的;2、基于密码学的方法带来了密钥管理的问题,一旦密钥泄露,用户的隐私也就不复存在,同时,密钥丢失也会造成用户无法取回数据。为了保护用户的数据安全,本文从架构入手,提出了一种基于软件定义云存储的存储方案,该方案基于软件定义云存储架构,利用CSP之间的竞争关系,通过将数据分块存储在不同的CSP上,保证数据的机密性;通过在不同的CSP上的文件块备份保证文件的完整性以及可用性。为了使文件的可取回概率达到最大,本文对文件的可取回概率模型进行建模,结合费用对存储方案进行建模,最后利用遗传算法对模型进行求解。本文将提出的存储方案与单云存储策略进行对比,结果表明,本文的存储策略可以有效提高数据的可取回概率,结合本文提出的架构可以有效的保证用户的数据安全。