基于SSE2的高性能串匹配算法研究

来源 :第8届全国并行计算大会 | 被引量 : 0次 | 上传用户:DKarson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
字符串的模式匹配性能的提高会给众多相关领域带来巨大的影响。本文选取最常应用的字符串模式匹配算法--朴素串匹配算法进行基于SSE2的优化。结果表明,基于SSE2的模式匹配算法性能明显好于C语言提供的strstr()函数。如何有效利用数据局部性是提高程序性能的一条关键因素,如何将数据快速装入XMMS寄存器是该算法要解决的一个主要问题。
其他文献
本文对万亿次机群系统NPB性能和可扩展性进行了研究。高性能机群的性能评测和并行程序的性能是我们研究的重点。理论峰值以及Linpack测试性能都不能代表高性能计算机的实际性
分子对接是计算机辅助药物分子设计(CAMD)中的一种重要方法,是大规模数据库筛选的理想途径。本文首先对分子对接理论进行了介绍,然后基于柔性配体分子与刚性受体分子的对接过程
本文通过对谱变换各部分计算进行分析,设计了一种64位32位混合精度谱变换计算方法。该方法对谱变换计算中精度敏感部分采用了64位高精度计算,精度不敏感部分采用用户指定精度
在遥感图像快速并行处理系统中,传统算法的并行化模式是直接影响计算性能的关键。本文以遥感图像的旋转算法为例,系统地研究了各种并行化方法,讨论了局部反演、斜条带算法、全局
本文介绍了η模式的历史沿革情况,论述了区域分裂并行算法在η模式的数值模拟中的应用试验情况。文章介绍了区域分割算法、边界数据的通信、数据通信与数据计算的重叠技术以及
区域分解是设计并行PDE方法的一个有力工具,目前已有很多关于区域分解方法的论文。参考文献通过在内边界点使用大空间步长H=mh的显式格式发展了有限差分区域分解算法。这种算
近年来,大图像扭曲处理成为了重点研究对象,但是目前的并行图像扭曲算法还没有同时能解决数据局部化问题和负载平衡。本文提出一种并行图像扭曲算法PIWA-LIC,该算法在考虑数据
在基因测序和粗略的序列相似性比对中,广泛采用以BLAST为代表的启示性算法,但该算法损失了敏感性,以Smith-Waterman为代表的动态规划算法是提高序列相似性的有效途径,其时间复
Task scheduling is of great significance to shorten performing time and minimize the cost for computational grid. A grid task schedule algorithm is presented in
Message-passing is an important and widely used parallel programming model for high performance computing. However, it is difficult to transfer complex data str