大规模图并行算法优化研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:Ruiming123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模图算法是移动互联网、物联网、大数据和生物信息处理等新兴应用的核心计算模式。本论文主要围绕两个大规模数据处理的基础算法开展研究:第一个是图遍历算法,是生物信息学、数据挖掘和计算社会学的核心算法;第二个是DNA序列匹配算法,对于微生物学和医疗信息学等学科有着重要的意义。  另一方面,结合计算机体系结构的算法优化一直是高性能计算的重要课题,并行体系结构尤其是多核和机群是大规模数据处理算法优化的主要挑战,例如,如何有效发掘多核机群的并行性来提高数据处理吞吐率,以及如何优化在大规模机群环境下的通信从而提高程序的可扩展性等。  本论文围绕在大规模多核机群上并行性发掘和通信优化展开研究。论文主要的创新性工作包括:  面向多核机群提出了一种多层并行图遍历算法。该算法发掘了处理器核级并行、指令级并行以及流水线并行,提高了访存带宽和负载平衡,在384核机器规模下性能是Graph500纯MPI版本的1.9倍,在6,144核机器规模下性能是ComBLAS纯MPI版本的1.49倍;  面向大规模机群提出了一种分布式图遍历算法中通信优化的方法。该算法使用分布式目录和实时压缩通信数据的方法,有效减少了算法的通信量。实验结果显示在6,144核机器规模下该算法对比Graph500原算法减少了79.0%的通信时间,性能是原算法的2.2倍,每秒能够遍历121亿条边。  定义了DNA序列分析算法中序列重叠计算的编程模型,降低了序列分析程序开发的难度并提高了程序可移植性。同时针对分布式计算环境实现了一个面向超大规模的DNA序列分析软件库,最多可以支持上百亿条DNA序列的存储、索引和查询,其中关键的优化包括分布式数据划分以及非阻塞查询设计。在IBM BlueGene/Q系统上的实验表明该库在65,536核机器规模下对11.92 TB随机DNA序列数据的查询性能可以达到每秒3.79亿次。另外,我们基于该库改写了一个名叫Kiki的元基因组从头测序软件,新Kiki的性能是原版本的6倍以上。
其他文献
现代大规模并行系统除了被广泛应用于传统的高性能计算领域外,还开始用于新兴的云计算领域。通过对近年来高性能计算体系结构和云计算体系结构发展的调研,发现系统互连是构成上
在互联网技术高度发展的今天,人们的生活方式已经跟互联网紧密结合。社交网络作为互联网在这一阶段的产物,满足了人们不同的在线社交需求。当前主流的社交网络有以信息分享为主
本文针对天文学交叉证认应用,对分布式连接(Join)算法进行优化研究,基于现有的连接算法基础,提出了基于MapReduce分布式计算框架下的BMJoin连接算法;经过理论分析和实验验证,本文
学位
计算机视觉和模式识别的主要目标是让计算机拥有类似人类视觉的功能,能够较好地分析、理解图像和视频的内容。在计算机视觉领域,物体检测一直是主要研究命题之一。物体检测的任
随着体系结构的发展,各种众核处理器结构已经出现,在单芯片上集成上千核已经可以实现,并会在不远的将来商用化。模拟这样庞大的处理器结构是个巨大的挑战。传统的模拟器都是串行
随着多媒体时代的来临,视频编解码作为一门音视频产业所依赖的共性技术而被广泛关注。微软公司提出的VC-1视频编解码标准是第三代高清视频编解码标准的典型代表,由于其整合了以
云计算和大数据等新应用模式的出现对计算机系统网络处理性能提出了更高的要求。与此同时,随着网络传输速度的快速提高以及处理器系统结构的不断改进,传统网络处理的机制、方法
近年来,随着Web服务的高速发展,HTTP流量增长迅速。如今HTTP协议已占据了互联网络流量中很大的一部分。由于HTIP协议灵活,流行度高,越来越多的网络恶意服务开始利用HTTP进行通信
话题模型是近年来在文本分析和挖掘领域比较流行的机器学习方法,不像传统的向量空间模型在高维稀疏的单词空间中刻画文档,它在表示文档时,通过使用隐话题将文档和单词联系起来。