基于异构计算的矩阵广义逆算法研究及实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:hedongxu2288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
广义逆矩阵理论不仅是许多数学分支的基本工具,更是在经济学、信息处理、自动控制、通信学、密码学和统计学等应用学科中都有着广泛的应用。因此,提升广义逆矩阵的计算性能有着非常大的实用价值,然而传统的CPU串行计算对此却无能为力。近年来,以OpenCL计算架构为代表的异构计算发展迅速,已广泛应用于多个领域,在图像视频处理、密码学等领域常用来进行运算加速,广义逆矩阵也可以通过OpenCL这种异构计算方式提升其计算性能。本文以异构计算为背景,以OpenCL为编程架构,实现广义逆矩阵的运算加速。本文首先对OpenCL规范作了简短介绍;基于GPU和FPGA的硬件架构,分别分析它们的OpenCL实现机制;由于GPU和FPGA在硬件架构与实现机制上是完全不一样的,它们的性能优化技术也迥然不同,因而分别对它们的优化技术进行分析。本文以运算所需的加法和乘法次数为指标,对三种常用的广义逆矩阵算法的计算复杂度进行分析,解方程法的计算量要略高于其他两种算法。然而通过基于异构计算的实现复杂度分析,在最小任务数、控制流、运算资源等关键指标上,解方程法要明显好于另外两种算法。综合计算复杂度和实现复杂度的分析结果,解方程法能获得更好的异构计算性能。因此本文以解方程法为基础设计一套基于异构计算的实现方案,在最优的并行度基础上,对方案中的多个模块进行并行化处理,并设计相应的同步点以保证数据的一致性。依据OpenCL的运行机制,分别对存储访问部分和数据处理部分进行深入优化,以提高算法的运算性能,并用MATLAB对该方案进行验证。本文分别在GPU和FPGA上实现该方案,并针对它们各自的架构特点,制定不同的优化策略和测试方案。测试结果表明:在计算误差方面,GPU由于其内部的浮点运算单位精度较高,其最大误差低至10-7级;而FPGA由于其内部的乘法器位宽仅为18位,其误差相对较大,最大误差在10-3级。与MATLAB标准函数运行时间相比,GPU平台凭借其成熟的开发理论和巨量的计算资源,加速比达到了1909;FPGA平台由于其开发理论不成熟,只获得34的加速比,但还有着巨大的提升空间。
其他文献
河道整治工程有着工程量大、战线长,且工程形式多样的特点,河道整治工程施工监理工作重要而复杂,尤其在工程的建设期间,做好现场监理质量控制、安全控制特别重要,从质量控制
绝缘栅双极晶体管(IGBT)作为新兴功率半导体器件广泛应用于智能电网、高速铁路、工业变频等战略产业领域。然而当前国内IGBT生产制造技术落后,产品可靠性能差,中高压IGBT芯片
2.5-3μm中红外波段的激光在激光医疗技术、遥感技术、大气环境监测以及光电对抗等方面的应用前景十分诱人,尤其是涉及被水强吸收和要求对生物组织穿透深度只有几微米的方面
近年来与随机粗糙面相关的应用越来越多,因此与它相关的电磁散射特性问题的研究受到了大量研究人员广泛而全面的关注,特别是关于它与三维散射体构成的复合目标的雷达散射截面
智慧旅游简析1概念目前,国内旅游业界和学术界对于智慧旅游还没有一致的定义。一般认为,智慧旅游,也被称为智能旅游,是一种以物联网、云计算、下一代通信网络、高性能信息处
随着大型土工管袋(抗浪砂袋)结构在国内外的应用和应用年限的增加,其管袋材料强度(抗浪流)和耐久性(无防护)已得到认可,被广泛应用;该结构的特点和优势重点体现在不用护面和就地取
运算放大器在如今的电路系统中随处可见,并且现在的运算放大器大都是具有特殊性能的专用运放。运放对微弱的信号非常敏感,很容易被环境中或者内部的噪声信号所影响,当噪声的
本文在对足球运动损伤的定义进行阐述后,就足球运动损伤发生率、损伤部位和性质问题进行了论述,并对足球运动损伤发生的原因进行了分析。
<正> 人权,是人类长期以来追求的目标,也是当今国际社会普遍关心的问题。那末,究竟什么是人权?人权概念的本质和基本内涵是什么?人权概念在人类社会的演进中经历了哪些重要的
<正> 从概念意义上讲,人权有两层涵义:其一是特指近代以来的人权思潮和人权制度;其二则是泛指作为社会主体的人的一般的直接社会权利,它与权利之底蕴相通。本文的人权概念之