分布式图计算内存缓存的优化方法与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xibao774313066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对符合幂律分布的大规模图数据的分析处理,分布式环境下BSP(bulksynchronous parallel)模型的计算效率优于链式MapReduce计算模型的计算效率。而在图计算任务开始前,分布式图存储的状况高度影响后期计算中的计算负荷以及消息传递量。图计算中任务由多次的重复迭代组成,每轮迭代的前后会读入数据,传出数据。  本文通过物化两个大规模数据集在PageRank作业下每轮迭代的数据交换量,实验数据充分证明了数据交换与图计算计算时间正相关。本文通过在点分割方法中,限制主顶点与它的从顶点的分布规模变得更小,将交换数据所需要的开销稳定下降至三分之一。在此优化基础上,本文继续提出了全新的任务感知的内存缓存技术,能够将每轮迭代前后传出的数据提前预取以供之后的读入使用。在这两种优化结合的基础上,实验证明分布式图计算任务能将计算效率提升1-3倍。
其他文献
学位
目前,Web服务已经成为了电子商务应用中一种有效的解决方案。基本的Web服务架构提供了分布环境下Web数据处理的标准化框架,但目前面向复杂应用的Web服务合成,仍有待进一步深入研
在作决策时,描述方案的各个属性对决策者而言,它们的权重是不同的。各个指标的权重的大小,对最终的评价结果起着至关重要的作用。因此,在建立综合评价模型时,各指标的权重确定是核
随着计算机的应用与互联网的普及,网络教学迅速发展,成为计算机学者和教育工作者关心和研究的热点。近期的研究多数以新型教学理论为依据,研究在网络环境下,以“学”为中心的教学
本文在分析现有主要的聚类算法的优缺点和适用范围的基础上,结合Web日志挖掘的特点,提出了一个适合对大规模事务数据,如购物篮数据和Web日志数据进行聚类挖掘的算法——直方图统
随着网络和多媒体技术的飞速发展,和网络视频相关的应用越来越多,人们对视频监控产品的要求也越来越高。SIP协议是一个信令控制协议,它提供了用户定位、媒体参数协商等功能。
软件复用是解决软件危机,提高软件生产效率和软件产品质量的现实可行的途径。基于构件的软件开发是软件复用的重要方法之一,其前提是存在大量可复用的构件,且复用者能够准确、高
随着云计算产业的发展,其核心技术之一——虚拟化技术在数据中心中得到了广泛的应用。虚拟机的动态迁移作为虚拟化技术的一项重要特性,在数据中心的管理中有着重要作用。而虚拟
面向服务的计算(Service Oriented Computing,SOC)是目前计算机领域的一个研究热点。采用基于Web服务的SOA(Service Oriented Architecture,SOA)构建Web服务应用(Web Service A
自从SSL(Secure Sockets Layer Protoco1)被提出以来,安全信道协议(简称安全信道)已经被广泛地应用于通过公共网络传输秘密消息。然而,直到近年来Canetti等学者才在UC安全框架(
学位