【摘 要】
:
目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性三角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性三角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性三角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性三角系统求
论文部分内容阅读
目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性三角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性三角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性三角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性三角系统求解的传统观点,即某一个变量的求解必须等到其所有前驱变量求解完成之后才能开始。这种方式不仅限制了求解时能够达到的任务并行度,无法充分利用众核处理器丰富的并行硬件资源。而且,线程间频繁的数据传递使同步开销较大,甚至抵消了并行计算技术带来的优势。针对现有方法存在的问题,本文提出一种基于部分值相加的并行求解算法。该方法首先并行计算变量的部分值,然后把变量的所有部分值相加得到变量的最终值。由于变量计算时无需等待所有前驱变量完成计算,大大提高了求解并行度和计算速度。在本文工作中,基于CUDA计算平台实现了并行求解算法。该算法把表示变量求解顺序的关联图分解成多个子图,每个线程计算子图的一层,充分利用了GPU丰富的并行计算资源。其次,为了减少存储器访问对算法性能的影响,充分利用了全局内存容量大及共享内存访存延迟低的特点,对本文提出的并行求解算法进行了优化。实验结果表明,与调用cuSPARSE库的求解算法以及无同步并行求解算法的计算时间比较,本文并行算法的计算速度平均提高80%,最大提高99%。在保证计算精度的前提下,大大提高了稀疏线性三角系统的求解速度。
其他文献
编者按:阿根廷瓷砖反倾销案自2013年终裁之后,因为高额的反倾销税征收,我出口瓷砖至阿根廷已经大幅度下降。该案原本在2018年才到期,2017年底会提起日落复审,但是阿根廷生产部突然在今年11月提起了一个复审调查,让业内人士感到十分奇怪,不知用意何为? 有业内人士建议有关企业不必特别关注本次复审,还是要为明年的反倾销日落复审做好申诉准备。 1 案件回顾 2012年7月27日,阿根廷对华瓷砖反
本文从艺术图式的角度分析文革时期石湾人物陶塑的图示语言和形象意义,分析文革时期石湾人物陶塑创作,在既服从于政治意识形态,又相应衍生出与之配套的技术语言时,完成对旧有艺术
3月20日下午,由恒大材料公司主办、三棵树涂料股份有限公司协办的第一批恒大战略合作伙伴区域交流会在福建莆田召开。广东博德精一建材有限公司(以下简称博德)营销副总经理陈海
目的探讨白内障超声乳化术中后囊破裂的原因及处理技巧.方法对43例(44眼)超声乳化术中后囊破裂原因分析:主要与撕囊、碎核、清除皮质等法有关.采用Healon回压保护破口,剪刀-
本刊讯 7月13日,南佛山市陶瓷行业协会主办,中国建材检验认证集团绿色产品院和佛山市南海区广工大数控装备协同创新研究院承办的绿色建材贯标暨精益管理培训会议和佛山市广工大
【正】腹部损伤是急诊外科常见的急腹症之一,病情重,变化快,易漏诊、误诊,直接威胁病人生命,我院于1994~1997年共治腹部损伤194例,现将临床诊治体会报道如下.1 临床资料1.1 一
利用稀土直接掺杂工艺合成了一种“常光充能”型电子陷获材料CaS∶Eu,Sm,它不仅具有CaS∶Eu无机发光材料的荧光光谱特性,而且具有红外升频转换特性,可将0.8~1.6μm的红外光直接转
本文提出了一种两维光测条纹图的相位测量技术--阶梯莆虚光栅解调算法,此法只需要获取一幅光载波条纹图,由计算机产生两个由N(整数)个象素构成、透射函数呈阶梯形分布、彼此间有一定