一般稀疏矩阵相乘的混合并行算法

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:YISHUIXIAOFENG2501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  稀疏矩阵相乘是在科学和工程计算中有广泛应用,是科学计算中的一种常用的基本运算。但也面临着数据量大,非零值分布不规则,负载难均衡,计算结果矩阵的列指数无规则分布等问题。通过矩阵分块、优化数据传输、负载均衡、改良并行快速排序法方法来解决上述问题,提高了计算效率。在多线程下计算速度比Intel MKL 的SPBLAS 平均提高56%。同时,还通过MPI+OpenMP 进行混合并行优化,在共享存储系统上两者有类似的计算速度。
其他文献
  STREAM是微处理器上内存性能的基准测试程序,在多核多线FT1000微处理器上发挥高性能是具有挑战性的研究工作.基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄
会议
  针对已有的基于结构相似性的图像质量评价算法的计算复杂高的不足,提出一种新的优化算法。针对亮度项中的均值计算,利用积分图像进行的加速计算;针对对比度项和结构项中的方
众所周知,阅读在高中英语中占有非常重要的比重,且在英语四项基本技能中处于极其重要的地位。可以说,阅读能力的高低成为学习者检验自身语言水平的重要指标之一。然而,很多研
  借鉴无损压缩编码中的GAP和GED预测器模板,改进该模版并应用在图像边缘检测中,提出一种新颖的基于多方向梯度边缘预测器(MGEDP)模板的动态阈值控制的边缘检测算法。以图像
会议
  多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题。传统的量子力学或分子动力学方法都难于处理多尺度体系中存在的现象。第一原理离散变分线性标度(DVM-DAC)
会议
  学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点
  传统虚拟机调度算法未充分考虑并行任务的执行效率问题,当多个虚拟机联合执行并行计算任务时,虚拟机管理器仍采用时分复用方式分配物理CPU(PCPU),导致并行任务串行化,效
会议
  开发了一个高效率和易扩展的基于GPU(图形处理单元,Graphic Processing Unit)的并行分子动力学模拟程序.程序能够在GPU 上处理固相共价晶体中原子间的多体相互作用.通过
2005年是抗日战争暨反法西斯战争胜利60周年,郭岭梅被大量媒体“揪”了出来,因为她是俊华日军细菌战纪录片《不只是“731“》的编导。也由此,记者得知1950年出生的她竟是诗人
  通过将Orthodir(m)算法两个向量内积改成几个连续内积,改变算法数据相关性,提出了改进的Orthodir(m)算法(IOrthodir(m)算法)。改进的算法具有与原算法相同的收敛性。理论分