并行超松弛算法和GPU并行隐马尔可夫模型

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:tlihao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究并行超松弛(SOR)算法和GPU并行隐马尔可夫模型算法。   分布式并行SOR的目标是收敛速度快和通信时间短,本文用重复计算代替通信,将经典的PSOR算法的通信由五次减为四次,节省大约20%的通信时间.为进一步减少通信时间,设计了一个新的快速并行SOR算法(FSOR),在二维网格上,对五点格式和九点格式,FSOR的收敛速度与串行SOR相同,通信次数也降到了最少,而且几乎所有的通信都能被计算重叠。   GPU通用计算是当前热点,本文在GPU上实现了红黑SOR算法和四色SOR算法,在分析多种方法优缺点的基础上,新的网格分割方法能避免线程空闲,消除CUDA程序分支,消除非合并访问,减少非对齐访问;在96核的GeForce显卡上实现了32倍的加速,在240核的Tesla显卡上实现了127倍的加速。   GPU上实现隐马尔可夫模型时,仔细研究了对数连加的数学性质,进而找到适合串行计算的嵌套方法和适合GPU并行计算的折半相加方法.设定正态分布方差的最小值来避免灾难性的向下溢出;设计符合GPU硬件特性的数据结构、综合使用避免双精度运算、共享内存/寄存器代替全局内存、转置矩阵消除非对齐访问、外层次并行减少内核启动次数等多种手段,一步步提高程序速度,实现了60倍左右的加速。
其他文献
根据澳大利亚国家出版环境局发布的2003年度报告显示,澳洲去年所用新闻纸总计将近72万吨,其中有近53万吨最终得以回收,这使得该国在去年一年的纸平均回收率超过了73.5%,比200
2011年中印农药生产商联合展览会及交流会于2011年7月4~5日在俄罗斯莫斯科举行,共有42家参展商,约300专业买家参加了展会。这些买家大部分来自俄罗斯本地,部分来自德国、英国
本文主要研究了高性能数控系统中的三项关键技术:数控系统中的数据压缩,针对样条曲线的速度规划与插补以及自由参数曲线路径轮廓误差的实时计算。   数据压缩算法的输入代码
本学位论文主要研究Riemann模空间的复测地线和闭测地线.   Riemann模空间的复测地线是Teichmüller空间的Teichmüller圆盘的像.等价地,Riemann模空间的复测地线是平坦曲
利用非线性发展方程描述并研究物理、工程力学和经济等领域中的关于时间变化的非线性问题,是非线性偏微分方程研究领域的一个重要研究方向。本文主要研究来自于粘弹性力学和结
本文研究了带有产品质量问题的供应链中由不合格产品引起的费用分配机制的最优设计以及供应链协调机制的最优设计问题。我们研究的供应链由一个销售商(或者制造商)从多个供应
数学课程的开设是初中科目教学中最基础的组成部分,同时也与人类日常生活有着密不可分的联系.因此,在对初中学生进行数学教学的过程中,教师要寻找一些更接近生活的数学内容,
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在Hilbert空间中,逼近次微分理论已有很广泛的应用,获得了许多深入的成果,但在一般Banach空间中,这些理论研究最近也受到人们的关注.   在本文中,我主要是在p一致凸且q一致光滑
自1965年,美国控制论专家L.A.Zadeh教授在“Fuzzy sets”[1]一文中,提出模糊集合概念以来,许多学者便投身到模糊集合理论及应用的各个分支的研究之中。无论是理论探索还是实践应