论文部分内容阅读
图像压缩编码能有效地减少图像内容中的冗余信息,从而节省存储空间和传输带宽。一般的图像压缩技术不仅要求具有较高的压缩比例而且需要更快的压缩速度,因此,提高压缩效率是图像压缩技术中的一个关键问题。CUDA技术的出现使得开发人员可充分挖掘GPU强大的并行计算能力以有效的提高计算效率。本文以3个计算复杂度高的典型压缩编码算法为研究对象,在GPU平台上设计其对应的并行算法,利用CUDA优化技术以充分地提高并行算法的计算效率进而满足快速处理的需求,主要研究工作和结论如下:(1)针对容错熵编码算法计算复杂度高而耗时长的缺点,利用并行计算在GPU平台上优化该算法。首先设计一个基于原始容错熵编码算法的并行算法,由于其加速效果不理想,研究并提出一种分块容错熵编码算法,该算法将变长码块分成多个组,在每个组中所有的码块放入给定的码隙中,其放置规则与原始算法相同,各组同时放置码块因而在GPU上实现一个粗粒度的并行。(2)灵活运用共享存储器、纹理存储器、常数存储器及线程块尺寸优化进一步加速并行分块容错熵编码算法。实验结果表明,相比其原始串行算法,并行分块容错熵编码算法当变长码块分成128(256)组时,在GPU上的加速可达32-123(54-350)倍。同时,分块容错熵编码算法还提高了其在有随机或突发错误信道传输中的容错性能。(3)针对二维正交匹配追踪算法计算复杂度高,但包含大量可并行计算矩阵运算的特点,提出一种基于GPU并行计算的二维正交匹配追踪算法。分析二维正交匹配追踪算法复杂度,发现更新权重模型中的矩阵求逆及投影模型是其计算瓶颈,故采用通过对比选择矩阵逆更新算法更新权重的策略,以减少矩阵求逆的复杂度。引入分块算法设计了一种并行快速的矩阵-矩阵相乘算法,以加速其投影模型的计算效率。(4)设计一种并行快速矩阵-向量相乘算法及并行归约算法求最大值以进一步提高并行二维正交匹配追踪算法的计算效率。实验结果表明,对于一幅的图像,当测量矩阵大小为()时,相比CPU串行代码,并行二维正交匹配追踪算法在GPU上可获得17-41(24-62)倍的加速;对于一幅的图像,当测量矩阵大小为时,其并行算法在GPU上可获得66-160倍的加速效果。(5)针对联合比特平面LDPC译码算法计算复杂度高但自身存在着并行性的特点,提出一种并行的联合比特平面LDPC译码算法。根据不同节点计算模式的不同,设计2种不同的并行模型:变量节点与校验节点之间标准并行BP算法和变量节点与符号节点之间并行BP算法。(6)根据计算符号节点总的概率分布函数和计算变量节点总的置信信息这2部分在联合比特平面LDPC译码算法中复杂度最高,提出一种数据分割算法将总概率分布函数的大数组分成多个小块并加载至能高速访问的L1缓存中。同时,引入一个转换数组以保证校验节点和变量节点更新过程能同时满足合并访问。实验结果表明,当采用长度为6336(50688)的LDPC累积码压缩信源时,并行联合比特平面LDPC译码算法比原始的串行算法快约20(41)倍。