基于改进的Rsync算法的文件同步系统设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:kjtx123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前人们享受信息化带来的便利的同时也深受海量数据难以管理的困扰,个人文件同步系统的产生和发展为这个问题带来一个比较好的解决办法。这种文件同步系统通过将个人文件夹内的数据实时同步到远程的服务端,为用户提供了一种安全,可靠,便捷的文件管理方式。  本文在深入研究了差量同步算法以及相关的文件切块算法,文件相似度算法,哈希算法的基础上,设计了一种两轮交互的差量同步算法VegaSync,并以此算法为核心构建了一套完善高效的文件同步服务系统。本文的主要工作如下:  1.提出一种两轮的差异文件同步算法。本文在深入研究经典的Rsync算法以及文件差量同步算法中涉及到的文件切块方式、文件相似度计算、数据块哈希值计算等问题的基础上,提出一种两轮交互的VegaSync算法。该算法第一轮利用基于内容的分块算法对文件进行分块,利用编辑距离算法计算文件之间的相似度并定位差异数据块,第二轮首先判断待同步文件的文件相似度,若文件相似度大于指定的阈值,则利用Rsync算法模块同步差异数据块。否则直接传输整个文件。  2.设计实现VegaDisk文件同步系统。本文参考主流文件同步系统Dropbox,Google drive等软件,设计实现了由Windows客户端,服务器,数据中心构成的VegaDisk文件同步系统,将VegaSync应用到系统中,高效地实现了文件的实时同步,版本管理,文件分享等功能。  3.对VegaSync算法进行性能测试。VegaSync算法第一轮以很低的网络和计算开销粗略地确定了待同步文件之间的差异数据块和文件相似度,第二轮根据文件相似度的高低来选择直接传输或是差量传输,有效地节省了网络和计算开销。在性能测试中本文从网络带宽消耗,同步时间,内存、CPU占用等方面对VegaSync算法和Rsync算法进行了对比测试,结果表明VegaSync在网络带宽消耗上较Rsync有30%的提升,CPU利用率上比Rsync低10%。
其他文献
本论文对基于空间运动图像的增强和超分辨率重建研究,主要针对空间飞行器定位、对接等情景中的图像处理问题进行研究。针对空间运动图像的特点和应用中出现的问题如边缘模糊
随着计算机技术的快速发展和数码产品的日益普及,个人数字多媒体文件的数量与日俱增。如何利用现有多媒体技术挖掘这些文件中蕴含的丰富信息,为用户提供形式更加新颖、功能更
随着暗物质的发现,暗能量的提出,特别是宇宙加速膨胀的发现,宇宙学正处于快速蓬勃发展的阶段,逐渐发展成一门精确的宇宙学[1]。由于宇宙高度非线性,长时间演化等特征,宇宙模拟计算
随着异构网络的不断融合,以及多种无线接入技术长期并存的趋势,多连接技术能够支持多接口终端保持多个网络连接同时通信,将广泛应用于未来异构网络中,各国际标准组织都展开了
中国古代建筑具有悠久的历史传承和辉煌的艺术成就,是中国文化中的一块瑰宝,对中国古代建筑进行建模研究是当前虚拟现实和计算机视觉领域的一项重要热点。古代建筑建模研究的成
计算流体力学(CFD)在航空航天等领域发挥着重要作用,该领域对先进CFD软件有着强烈的需求。随着计算技术的发展,众核构架计算机在大型计算机成为了主流。将CFD程序移植到众核构
本文对运动图像增强与网络环境下图像信息跨尺度分析与融合进行了研究。图像增强是指根据特定的需要突出图像中的重要信息,同时减弱以及去除不需要的信息。网络环境下图像信
随着互联网的不断发展,网络大众的视频消费需求不断增加。流媒体技术由于其具有边下载边观看的特点,能够满足用户快速观看视频节目的需求,已成为大众网络视频消费的主要方式。同
三网融合是指电信网、互联网和广播电视网三大网络通过技术改造实现物理层的互联互通,业务层的相互渗透,具体表现为在技术上趋于一致,且都能为用户提供语音、数据、图像等综
无线感知反应网络,由大量具有数据采集、处理、无线通信能力的微型低功耗感知节点及反应节点通过多跳通信的方式组成,协作完成大规模复杂的监测和控制任务。由于无线感知反应