PLASMA自适应调优与性能优化的设计与实现

来源 :2011年全国高性能计算学术年会(HPC china2011) | 被引量 : 0次 | 上传用户:huyuexing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行和乱序执行机制大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。
其他文献
  现代GPU一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(CUDA、OpenCL)都定义了特定程序设计接口(CUDA的纹
会议
2001年北京大运会体操冠军张尚武近日受到社会的广泛关注,其程度远远超过他当年“为国争光”的时候。原因是他以盗窃罪入狱三年十个月刑满释放后在王府井街头卖艺乞讨,一经网
2020年11月27日,《上海市促进家庭农场发展条例》经上海市第十五届人民代表大会常务委员会第二十七次会议表决通过,从2021年1月1日起正式施行.这是国内首个关于家庭农场的地
期刊
  视频转码是一项耗时耗资源的工作。随着视频数据量的急剧增大,传统转码方式已经不能满足人们对效率和质量的需求。云计算通过整合、调配计算资源向用户提供强大的计算能力
会议
正六千张便利贴能够做什么?提醒?记事?或是,拼出可爱的心型? 2009年,24岁的台湾学生刘邦耀把它们糊在了墙上,搭配真人演出,拼成了动画。一分五十五秒的短片,用了他三个月的制
这天,家住四川江油市重华镇的梅文杰大爷告诉记者:“我把自己多年淘得的2000多件收藏品拿出来免费展览,一心想把重华古镇的灵魂留住!我希望大家能和我一起保护好重华古镇的根
韭菜是可以周年进行生产,一年四 季供应的蔬菜。由于韭菜生长周期短,有 些病害较难防治,因此,有些地方大量滥 施乱用剧毒农药和化学肥料,致使韭菜 产品中的农药残留严重超标,对广大
  当前含有SIMD功能部件的计算机体系结构中,其向量部件与标量部件一般可并行工作。为了提高系统的硬件资源利用率,论文针对向量化循环,提出了基于混合并行的分段展开变换方法
大型水利枢纽工程建设不可避免地引起当地流域水温变化,尽可能减少损失成为水利智能化发展的综合考量因素.水温研究为生态保护、经济发展提供可参考的数据方案,对水利发展具
  在科学计算和数据分析中,存在着许多重要的迭代式应用,这类应用的输入数据和中间数据常存在一定的数据偏移现象,在类MapReduce系统上运行时,往往会因负载不均衡而产生Straggl
会议