有限元结构分析的层级负载均衡并行计算方法

来源 :科学通报 | 被引量 : 0次 | 上传用户:tananhua252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于性价比高、计算能力强,多核机群已经成为当今高性能计算的主流工具.然而,多核机群环境下不同的存储机制和通信延迟特点也为高效并行算法的设计带来了挑战.为充分利用多核机群的硬件资源获取最优性能,本文设计了一种有限元结构分析的层级负载均衡并行计算方法.该方法建立在对计算任务的层次性和粒度性充分挖掘的基础上.为与多核机群的硬件拓扑体系结构相适应,本文将计算任务划分为三个层次:节点间并行、片间并行和核间并行.其中,节点间并行和片间并行采用粗粒度并行计算方法,而核间并行采用细粒度并行计算方法.通过将计算任务映射到多核机群的不同硬件层面执行,该方法不仅有效实现了不同层面的负载均衡,而且大幅度降低了系统的通信开销.此外,它还大幅度减少了子区域的数目,有效提高了界面方程的数值收敛性.为验证算法的有效性,在“天河二号”超级计算机上进行了有限元结构线性静力分析大规模并行计算测试.结果表明:同传统区域分解法相比,层级负载均衡并行计算方法能够获得较高的加速比和并行效率.本文的研究主要集中在线性静力学问题上.对于非线性问题或者动力学问题,由于涉及多个迭代步,因此可以将本文算法封装为一个子函数进行调用. Due to its high performance-price ratio and high computing power, multi-core cluster has become the mainstream of high-performance computing today.However, different memory mechanisms and communication delay in multi-core cluster environment also challenge the design of efficient parallel algorithm.In order to make full use of multi-core In this paper, we design a hierarchical load balancing parallel computing method of finite element structural analysis, which is based on the full mining of the hierarchical and granularity of computing tasks. Hardware topology architecture, this paper divides the computing tasks into three levels: parallelism between nodes, parallel between slices and parallel between cores.One of the parallel and interchip-parallel methods uses coarse-grained parallel computation, and the parallel between cores Fine-grained parallel computing method by mapping computing tasks to different hardware layers of a multi-core cluster, this method not only effectively implements load balancing at different levels but also greatly reduces the communication overhead of the system. In addition, it also significantly reduces The number of sub-regions, effectively improve the numerical convergence of interface equations.In order to verify the effectiveness of the algorithm The results show that compared with the traditional regional decomposition method, the hierarchical load balancing parallel computing method can achieve a higher speedup Ratio and parallel efficiency.The research of this paper mainly focuses on the problem of linear statics.In the case of nonlinear problems or dynamics problems, the algorithm in this paper can be encapsulated as a subroutine to be called because it involves multiple iteration steps.
其他文献
“小樱桃,快醒醒!小樱桃……”小樱桃正睡得迷迷糊糊,忽然听到有人好像在喊她。她睁开眼一看,原来是pupu。pupu见小樱桃醒了,欢快地在空中转了几圈,然后很亲昵地蹭蹭小樱桃的
博奕通胀  策划 / 本刊编辑部  执行 / 苏龙飞    围绕成本转移,上下游都费尽心思,以重塑行业利益分配格局  物价再次成为公众关注的焦点。自2010年以来,通胀压力持续上升,市场上涨价的声音此起彼伏。比如,茅台与五粮液的涨价风波、康师傅与家乐福的口水战、奶业的集体涨价等等。  回顾2010年CPI(居民消费物价指数)及PPI(工业品出厂价格指数)走势可知(如图一),全年PPI呈波浪向上走势
“哇,好大的猫头!哪来这么大的猫?”外福来和小猫都来欣赏鱼缸中的小鱼。猛一抬头,外福来被透过鱼缸的大猫脸吓了一大跳。“不怕不怕,盛满水的鱼缸就好像是一个凸透镜,小猫的
初唐诗杂考(十九)杨墨秋《和上巳连寒食有怀京洛》非孙逖诗《全唐诗》卷九十六沈期诗《和上巳连寒食有怀京洛》在卷一百十八孙逖名下重出。《文苑英毕》亦将此诗收在孙逖名下。
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
新型隐球菌脑膜炎较少见,因无特异性临床表现常被误诊,误诊率40%左右,现报我们误诊3例如下。例1,男,41岁,入院前40天全身不适、发烧,头痛渐重,半月来呕吐。他院腰穿发现脑脊
【精彩片断】师:这节课就让我们走近瀑布,跟随作者的脚步,去听听瀑布的气势非凡,去看看瀑布的雄伟壮观吧。读读课文,画出相关语句,在旁边写下自己的理解和感受。(生自由阅读,
近日,科技部火炬中心组织认定了新一批国家科技企业孵化器。其中,河南省平顶山高新技术创业服务中心和郑州经济技术开发区留学人员创业园管理服务中心被认定为国家级科技企业孵化器。截至目前,河南省国家级科技企业孵化器增至12家,数量位居中西部前列。  科技企业孵化器是以促进科技成果轉化、培养高新技术企业和企业家为宗旨的科技创业服务机构,是国家创新体系的重要组成部分,是区域创新体系的重要核心内容。认定为国家级
新年伊始,三星集团任命副会长姜皓文为中国区总裁,成为集团最高级别的海外CEO。前任朴根熙任期届满回国。三星解释这一人事安排,既是因为中国三星规模巨大,也是为了“在中国
规划面积不到18平方公里,这在全国的高新区中是相当袖珍的了。然而,就在这有限的发展空间里,南宁高新区却造就了一个无限发展的奇迹。2010年,南宁高新区实现营业总收入667亿