异构平台中并行矩量法的加速技术

来源 :微波学报 | 被引量 : 0次 | 上传用户：tzflz108

【摘要】

：

本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分

【作者】

：

陈岩张光辉林中朝张玉赵勋旺

【机构】

：

西安电子科技大学电子工程学院,

【出处】

：

微波学报

【发表日期】

：

2014年S1期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文主要研究了在CPU/GPU异构集群上的并行矩量法的加速技术。本文设计出一种MPI/CUDA软件编程架构,解决了CPU/GPU异构集群上并行LU分解跨节点计算的难题。此架构基于矩阵分块二维循环分布的数据分配策略,利用MPI实现计算节点之间的通信,同时利用GPU加速矩阵更新过程。为了突破GPU显存对LU分解的矩阵规模的限制,本文进一步研究了“显存—内存”核外算法。为了优化算法性能,本文提出了基于“CUDA流”技术和“异步通信”技术的设计方案,实现了GPU通信与计算的重叠,有效隐藏了GPU通信时间,获到了明显的加速效果。 This paper mainly studies the acceleration technology of the parallel method of moments on CPU / GPU heterogeneous clusters. This paper designs a MPI / CUDA software programming architecture that solves the problem of parallel LU decomposition across nodes in CPU / GPU heterogeneous clusters. Based on the data distribution strategy of two-dimensional cyclic distribution of matrix partition, this architecture uses MPI to realize the communication between computing nodes and at the same time accelerates the matrix updating process by using GPU. In order to break the limit of matrix size of LU decomposition by GPU memory, this paper further studies the “memory-memory” extra-core algorithm. In order to optimize the performance of the algorithm, a design scheme based on “CUDA stream” technology and “asynchronous communication” technology is proposed in this paper, which realizes the overlap of GPU communication and computing, effectively hides the GPU communication time and achieves obvious acceleration effect .

其他文献

基于电荷累积效应的飞机雷击分区快速仿真研究

自然界常见的雷击会直接威胁飞机的飞行安全,为了进一步了解飞机的雷电环境,提高飞机雷电防护能力.本文采用ANSYS公司的准静态电磁仿真软件Q3D Extractor,利用边界单元法对等

会议

电荷累积效应飞机雷击分区飞行器电磁仿真软件雷电

推进中国证卷市场国际化的策略

我国经济的改革开放是在世界经济日益向着一体化、国际化方向发展的大背景下展开的，经济改革开放决定了我国证券市场的发展必然顺应证券市场国际化的潮流，走一体化、国际化的发

期刊

市场国际化证券市场国际债券经济改革开放人民币汇价股票指数期货外汇调剂价外汇管理制度金融机构基金业务

“三高”患者如何安全度夏

炎热夏季,人体的新陈代谢比较旺盛,血糖、血压、血脂都会比冬春季节情况理想或更趋于正常。这种现象常常会对三高患者带来迷惑或误导,认为病情恢复较好而放松用药甚至轻易停

期刊

安全度夏科学合理用药内脏脂肪血小板聚集性身体肥胖血液浓缩锻炼时间脂肪率低盐饮食锻炼项目

实践导向的高职教育课程改革与创新

随着教育的发展,当下高职院校在理论和实践相结合的教学模式中不断改进教学方法,加大改革创新力度,产生了良好的效果.而一些高职院校在实施人才培养方案过程中,因为受到了某

期刊

实践导向高职教育课程改革与创新

论保险市场的竞争与合作

保险是金融业的三大支柱之一。立足江苏保险市场现状,着眼于江苏保险事业的永续发展,研究探讨规范市场竞争,加强同业合作,具有重要而深远的意义。一、完善监管体系,培育健康

期刊

保险事业商业保险保险供给经营许可证保险市场竞争展业不和谐音符保险法规偿付能力监管防范化解

一种用于有损耗慢波结构有限元本征分析的多波前块ILU预处理

多波前块ILU(MFIBLU)预处理是一种用于处理有损耗行波管慢波结构三维有限元本征分析中产生的大型复数不对称线性广义本征问题的预处理技术."改进的多波前法"和"新型不完全分

会议

损耗慢波结构结构有限元本征问题分析多波前法预处理技术行波管

国外三种单船扫油系统

近年来,国外溢油回收设备正向着体积小、重量轻、安装方便及操作简单等方面发展。过去常用三船扫油系统进行扫油和收油。此系统需要三条船,同时海上操作复杂,机动性差。因此

期刊

单船溢油回收溢油机动性设备安装围油栏拖船斯普林船上条船

基于结点基函数的时域有限元方法仿真微波无源器件

在仿真微波无源器件时,有限元法(FEM)对多个频率点需重复计算,且很难精确模拟非线性器件及非线性介质,时域有限差分法(FDTD)需采用规则的网格剖分,不能很好地模拟具有弯曲表

会议

并行高阶矩量法分析地基天线对飞机近场影响

电磁干扰一直是影响客机正常起飞和降落的关键性问题之一。分析地基天线对大型飞机近场的影响可以作为机场附近天线布局的指导。然而由于计算机存储资源的限制,难以对复杂的

会议

高阶矩量法矩量法分析地基天线布局大型飞机近场分布计算机平台电大尺寸目标

对完善我国房地产估价师执业资格制度的几点意见

自《城市房地产管理法》颁布以来,有关行政主管部门和中国房地产估价师学会,围绕我国房地产估价师执业资格制度建设做了大量工作,已经发布了《房地产估价执业资格制度暂行规

期刊

房地产估价师执业资格制度房地产交易所房地产行政资格等级房地产经营管理工作环境伴生性中介行业暂行规定

异构平台中并行矩量法的加速技术

其他学术论文