【摘 要】
:
计算流体力学(Computational Fluid Dynamics)和有限差分方法(FiniteDifference Method)是科学计算中最为常用的计算方法,其单指令多数据流(SIMD)的计算特点为GPU加速提供了可
【出 处】
:
中国科学院研究生院 中国科学院大学
论文部分内容阅读
计算流体力学(Computational Fluid Dynamics)和有限差分方法(FiniteDifference Method)是科学计算中最为常用的计算方法,其单指令多数据流(SIMD)的计算特点为GPU加速提供了可能。本文针对二维机翼的跨音速扰流模拟这一典型问题,利用近年来最流行的GPU编程模型--CUDA进行加速,探索针对计算流体力学和有限差分方法的初步GPU计算框架,以期对这两个方法所适用的其它应用问题提供借鉴。
本文主要内容如下:
首先,以NVIDIA的TeslaC1060为例,描述了GPU的基本架构,介绍了CUDA线程和内存层次。并展示了CUDA中线程级的细粒度数据并行和任务级的粗粒度并行的双层并行模式。
然后,介绍了机翼跨音速绕流中使用到的数值方法。给出问题出发的可压缩Navier-Stokes方程。简单介绍了有限差分方法的基本思想,对方程中的粘性项和非粘性项分别采用5阶精度的迎风格式和6阶精度的中心差分格式进行数值离散,以正确反映物理特性。由于采用显式的格式,在时间项上,采用了三阶精度的Runge-Kutta方法,时间步长用CFL条件进行限制。
接下来,介绍了机翼跨音速绕流在CUDA平台上的实现,并总结了计算流体力学和有限差分方法在GPU上应用的初步计算框架,并将这个框架应用到三维地震波传播问题。描述了GPU作为CPU协同处理器的工作机制、以结构化网格为特征的计算流体力学问题在CUDA上的任务分解策略、CUDA平台上的各种存储器的性能优化策略、以6阶中心差分格式为例讨论了有限差分方法在GPU的实现。为了使用GPU集群来加速,提出了两种MPI+CUDA的方案,并以三维地震波传播为例,实现了其中之一。
最后,将CUDA程序与CPU的Fortran程序以及实验进行对比。结果表明,GPU上得到的结果和CPU以及实验结论符合的很好,GPU相比CPU最高得到了23倍的加速比。展示了GPU强大的计算能力和GPU计算的可靠性。
其他文献
作为信息隐藏的一个重要方向,隐写技术致力于在数字载体中嵌入一定容量的秘密信息,并使得嵌入后的载体能够从视觉感官和隐写分析的角度都具有不可感知性。人类视觉系统具有以
中枢神经系统疾病(CNS disorders)是一组由慢性进行性中枢神经组织退行性变性而引起的疾病总称,主要包括:帕金森病(Parkinsons disease,PD)、脑小血管病(Cerebrovascular disease
随着计算机技术和通信技术的迅速发展,用户需求不断深化与增长,网络规模日益增长,计算机网络应用越来越广泛,用户业务对信息技术的依赖性日益增加。同时,网络病毒、黑客入侵、拒绝
微米木纤维模压加工过程是一个高度复杂的过程,具有非线性、时滞、高维等特性。模压产品具有较高的密度,可以用于装饰装潢,具有较高的应用价值。握钉力是衡量材料力学物理性能的一个重要指标,当材料使用螺钉相连接时,握钉力大小就显的尤其重要。因此,对模压产品的握钉力进行预测成为微米木纤维模压加工研究的重要课题。本文以模压的汽车换挡杆手柄为对象,将机器学习引入到模压产品的握钉力预测上,通过机器学习方法找到一种有
概念是知识表示的核心要素。因此,概念的提取是知识提取中最核心的任务。如何有效地从各类资源中挖掘概念实例是知识提取研究中的一个关键问题。本文分别针对特定领域文本的概
随着信息通讯技术和互联网的发展,互联网金融信息对金融市场的影响已经越来越不容忽视。某一个新事件的发生或者是网络上对某支股票的热议都在很大程度上左右着金融实践者们
随着工业机器人应用范围越来越广,人们对机器人的运动精度也提出更高的要求。由于各种误差因素的影响,机器人理论位姿和实际位姿总是存在着一定的误差,这个误差严重影响着机
随着时代的不断进步,计算机与网络的性能取得了飞速的提高;与此同时,科学研究领域以及工程领域对于计算能力的要求也在与日俱增。在这样的背景下,网格计算技术应运而生。网格
随着高精度质谱技术的飞速发展,基于生物质谱分析的蛋白质、肽段鉴定已经成为蛋白质组学的核心技术。蛋白质、肽段鉴定方法主要分为两大类:数据库搜索和肽段从头测序。数据库
自从Adleman首次利用DNA分子及生化反应求解困难的计算问题以来,不少研究人员希望借助DNA分子海量并行的计算能力、高密集的存储能力及其特定的生物活性来设计一种新型的DNA