虚拟计算平台UniAS中大文件并发处理模块的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户：vvlioo

【摘要】

：

本文的工作是为北京大学软件工程研究所正在研发的基于Erlang OTP(OpenTelecom Platform)的虚拟计算平台UniAS提供处理大文件数据的能力，设计并实现了大文件并发处理模块。本

【作者】

：

高云鹏

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2013年期

【关键词】

：

分布式计算虚拟计算平台大文件并发处理函数式语言 Erlang OTP 应用程序

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文的工作是为北京大学软件工程研究所正在研发的基于Erlang OTP(OpenTelecom Platform)的虚拟计算平台UniAS提供处理大文件数据的能力，设计并实现了大文件并发处理模块。本文调研并分析了现有的大文件处理技术，重点考虑了如何将分布式文件系统中的大文件合理地自动切分为若干个小数据块，然后设计了一种MapReduce框架对文件中的数据进行处理，给出了基于Erlang OTP的系统实现。　　本文的工作可以分为三个方面:对输入的大文件进行切分、对分割后的若干个小数据块进行Map和对Map得到的结果进行Redcue。在进行切分的时候，将切分后的数据映射到每个计算节点的本地进程空间，减少分布式文件系统的负载，并且保证不破坏原来输入文件中数据的结构;在进行Map的时候，使用Hash(散列)的方法计算切分后的小数据块，将具有相同Hash值的数据映射到同一个数据块中;而在Reduce的过程中，利用Erlang语言提供的ETS分布式数据库来进行归并计算，在Reduce的最后阶段，合并所有计算节点上的计算结果得到一个最终的结果文件。　　通过本文的工作，给系统提供了处理大文件的能力，从而使系统可以较好地处理数据密集型的计算，充分地利用每个可用的计算节点上的CPU和IO资源，提高了资源的利用率。　　最后，为了验证本文工作的有效性，提供了一个示例性的数据密集型的应用程序，验证了本文所设计的模块的有效性，实验结果说明本文的工作基本上达到了预期的目标。　　

其他文献

数据驱动的人体运动逆向动力学技术研究

在计算机图形学、生物力学和机器人等领域一个经典问题是如何在已知运动学信息情况下，求解计算地面接触信息和关节力矩信息。在本文中，我们聚焦于个体相关的人体惯性参数建模、

学位

生物力学数据驱动逆向动力学人体运动

基于级联二部图的动态推荐算法

在当今这个信息爆炸的时代，互联网上的信息和数据让人眼花缭乱。推荐系统在对信息和数据的过滤和筛选过程中扮演着重要的角色，推荐系统的存在和发展为互联网用户带来了诸多便利

学位

推荐系统协同过滤动态推荐图模型时间效应

职工社会医疗保险计算机管理信息系统

职工社会医疗保险计算机管理信息系统采用客户机/服务器计算模式,以Windows NT为网络操作系统,以PowerBuilder为开发工具,以SQL Server为数据库系统,以公用电话网为通讯工具,

学位

职工社会医疗保险计算机管理信息系统

三维大波数Helmholtz方程的并行预条件迭代法

Helmholtz方程广泛地用来刻画波传播和逆散射现象，它在若干工业技术领域有着重要的应用，如航空航天、海洋技术、油气勘探等。由于其重要性，Helmholtz方程的数值求解引起了广泛的

学位

Helmholtz方程多重网格延拓算子并行预条件迭代法数值求解

XML查询中具有位置谓词的树模式匹配方法

随着计算机网络技术的发展，可扩展标记语言(XML)已经成为互联网上数据表示和传输标准，XML被普遍地用于异构信息和异构平台之间数据交换和数据共享。为了满足查询和处理XML数据

学位

XMLXPathTwig查询

典型观测模式下的空间天文卫星多任务规划方法研究

随着我国空间科学的迅猛发展，空间天文观测揭开了我国探索空间科学现象的新篇章。天文观测任务规划是天文观测的前提，如何针对空间科学探测的多种模式进行任务规划，满足多种模式

学位

天文观测科学卫星多任务规划自适应控制

基于FPGA的H.264视频压缩编码SOPC设计

近几年来，智能移动终端和新一代移动网络的普及给视频应用提供了广阔的空间。但是，相对于日渐庞大的视频业务需求，网络资源是极其有限的。为此，学术界和产业界投入了大量的精力进

学位

H.264FPGA软编码系统双精度浮点运算单元帧内编码回路

基于游戏引擎的手机短信3D动画自动生成系统中场景规划的设计与实现

全过程游戏自动生成技术是中国科学院陆汝钤院士提出的一个构想，希望能够通过自然语言创建脚本，通过游戏脚本，添加游戏的元素最终生成一个游戏。基于游戏引擎的3D手机动画自动生

学位

手机动画自动生成手机短信场景定量规划游戏引擎空间规划

双波段红外火焰探测报警系统的软件设计

该文简要介绍了双波段红外火焰探测系统的主要设计依据,阐述了其基本工作原理,介绍了系统中与软件设计相关的硬件组成,尤其是双波段红外火焰探测器的硬件设计,并给出了控制器

学位

双波段红外火焰探测器火焰探测系统

复杂收益安全博弈研究

关于安全博弈的研究近年来广受重视，许多基于安全博弈论的系统已在现实世界中得到了成功应用。在该研究的理论框架中，博弈双方为安保部门和不法分子。其中安保部门首先确定一种

学位

图论复杂收益安全博弈均衡求解算法建模仿真

虚拟计算平台UniAS中大文件并发处理模块的设计与实现

其他学术论文