【摘 要】
:
深度优先搜索算法在GPU集群中大型图上的简单执行,会导致线程间的负载不平衡和无法合并内存访问的情况,使得算法的性能较低.为了获得在单个GPU和多个GPU环境下性能的明显提
【机 构】
:
衡阳师范学院 计算机科学系,湖南省衡阳市 421002
论文部分内容阅读
深度优先搜索算法在GPU集群中大型图上的简单执行,会导致线程间的负载不平衡和无法合并内存访问的情况,使得算法的性能较低.为了获得在单个GPU和多个GPU环境下性能的明显提高,在处理数据之前通过采取一系列有效的操作进行重新编排.提出了构造线程和数据之间映射的新技术,通过利用前缀求和及二分查找操作来达到完美的负载平衡.为了降低通信开销,对DFS各分支中需要进行交换的边集执行修剪操作.实验结果表明,算法在单个GPU上可以尽可能地实现最佳的并行性,在多GPU环境下可以最小化通信开销.在一个GPU集群中,可以对含有数十亿节点的图有效地执行分布式DFS.
其他文献
《弯弯的月亮》这首很不错的歌是李海鹰的成功之作。它自89年推出后,便亮堂堂地“挂”在中国歌坛达5年之久,成为′93中国十大金曲之一。作曲家李海鹰在其前后创作的《梦江南
翁独健,原名贤华,福建省福清县人。一九○六年十一月二十八日出生于一个贫寒的农民家庭。三岁时患小儿麻痹症,从此终身左腿残跛。天资聪颖,读书勤奋,在本县融美中学,福州英华
在处于不同地理位置的数据中心之间进行虚拟机的在线迁移,有助于在较大范围内进行资源的优化调度,但是这目前还存在一些困难,其中一个主要问题是缺乏有效的方法在广域网上把
在当前主流的众核异构高性能计算机平台上开展超大规模CFD应用的高效并行数值模拟仍然面临着一系列挑战性技术问题,也是该领域的热点研究问题之一.本文面向天河2高性能并行计
老舍为自己的作品写广告 1934年12月,《论语》半月刊连载老舍的长篇小说,文尾尚余空白一处,老舍遂为自己的作品写了一则妙趣盎然的广告: 《老舍幽默文集》不是本小说,什么也
聚类是研究空间多变量数据的重要工具之一.但是自动聚类算法通常需要用户预设参数然后生成结果,缺乏一种有效的交互机制将用户介入到聚类的过程,使之动态改变参数并对结果进
为适应海量地震数据以及集群并行规模不断增大的趋势,本文提出了多维度成像空间分解算法.根据大规模集群系统有多个并行层次的特征,首先沿炮检距方向分解成像空间,然后再沿In
核废物处理是制约一个国家核事业发展的重要因素,其处理结果的好坏将直接关系到国家的核安全及人民的生活。核废物地下处置的核心即使用多种工程/天然屏障来阻止、延迟核
首先,本文介绍了SIMD扩展技术,并分析了使用SIMD扩展的三种方式,认为通过调用特定目标平台优化的第三方库是应用领域软件开发者快速开发高效并行程序的较好的方式:其次,介绍
高血压是临床上常见的多发的一种慢性疾病,该病主要以舒张压和(或)收缩压超过健康范围为主要特征,在高血压的长期影响之下,患者的各项器官和组织会发生不同程度的功能障碍或