基于GPU并行计算的图像压缩技术研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户：hafuu

【摘要】

：

图像压缩编码能有效地减少图像内容中的冗余信息，从而节省存储空间和传输带宽。一般的图像压缩技术不仅要求具有较高的压缩比例而且需要更快的压缩速度，因此，提高压缩效率是图像

【作者】

：

代媛

【出处】

：

西北农林科技大学

【发表日期】

：

2014年期

【关键词】

：

图像压缩并行计算 GPU CUDA 容错熵编码算法二维正交匹配追踪算法联合比特平面LDPC译码算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像压缩编码能有效地减少图像内容中的冗余信息，从而节省存储空间和传输带宽。一般的图像压缩技术不仅要求具有较高的压缩比例而且需要更快的压缩速度，因此，提高压缩效率是图像压缩技术中的一个关键问题。CUDA技术的出现使得开发人员可充分挖掘GPU强大的并行计算能力以有效的提高计算效率。本文以3个计算复杂度高的典型压缩编码算法为研究对象，在GPU平台上设计其对应的并行算法，利用CUDA优化技术以充分地提高并行算法的计算效率进而满足快速处理的需求，主要研究工作和结论如下：（1）针对容错熵编码算法计算复杂度高而耗时长的缺点，利用并行计算在GPU平台上优化该算法。首先设计一个基于原始容错熵编码算法的并行算法，由于其加速效果不理想，研究并提出一种分块容错熵编码算法，该算法将变长码块分成多个组，在每个组中所有的码块放入给定的码隙中，其放置规则与原始算法相同，各组同时放置码块因而在GPU上实现一个粗粒度的并行。（2）灵活运用共享存储器、纹理存储器、常数存储器及线程块尺寸优化进一步加速并行分块容错熵编码算法。实验结果表明，相比其原始串行算法，并行分块容错熵编码算法当变长码块分成128（256）组时，在GPU上的加速可达32-123（54-350）倍。同时，分块容错熵编码算法还提高了其在有随机或突发错误信道传输中的容错性能。（3）针对二维正交匹配追踪算法计算复杂度高，但包含大量可并行计算矩阵运算的特点，提出一种基于GPU并行计算的二维正交匹配追踪算法。分析二维正交匹配追踪算法复杂度，发现更新权重模型中的矩阵求逆及投影模型是其计算瓶颈，故采用通过对比选择矩阵逆更新算法更新权重的策略，以减少矩阵求逆的复杂度。引入分块算法设计了一种并行快速的矩阵-矩阵相乘算法，以加速其投影模型的计算效率。（4）设计一种并行快速矩阵-向量相乘算法及并行归约算法求最大值以进一步提高并行二维正交匹配追踪算法的计算效率。实验结果表明，对于一幅的图像，当测量矩阵大小为（）时，相比CPU串行代码，并行二维正交匹配追踪算法在GPU上可获得17-41（24-62）倍的加速；对于一幅的图像，当测量矩阵大小为时，其并行算法在GPU上可获得66-160倍的加速效果。（5）针对联合比特平面LDPC译码算法计算复杂度高但自身存在着并行性的特点，提出一种并行的联合比特平面LDPC译码算法。根据不同节点计算模式的不同，设计2种不同的并行模型：变量节点与校验节点之间标准并行BP算法和变量节点与符号节点之间并行BP算法。（6）根据计算符号节点总的概率分布函数和计算变量节点总的置信信息这2部分在联合比特平面LDPC译码算法中复杂度最高，提出一种数据分割算法将总概率分布函数的大数组分成多个小块并加载至能高速访问的L1缓存中。同时，引入一个转换数组以保证校验节点和变量节点更新过程能同时满足合并访问。实验结果表明，当采用长度为6336（50688）的LDPC累积码压缩信源时，并行联合比特平面LDPC译码算法比原始的串行算法快约20（41）倍。

其他文献

针灸治疗枕大神经痛25例

笔者从1999年～2004年采用针灸治疗枕大神经痛25例,效果较好,现报道如下.1 临床资料25例中,男11例,女14例;年龄最小15岁,最大72岁;病程最短1天,最长3年;头痛位于左侧10例,右侧1

期刊

枕大神经痛针灸治疗

乌鸡白凤丸为主治疗乳腺增生症500例

期刊

乳腺增生症乌鸡白凤丸活血化淤

双黄连粉针剂治疗小儿上呼吸道感染20例

近几年来，我们应用哈尔滨中药二厂生产的注射双黄连粉针剂治疗上呼吸道感染，有显著的疗效，并与病毒唑及其他抗生素治疗上呼吸道感染进行了疗效比较，现报告如下。……

期刊

双黄连粉针剂治疗小儿上呼吸道感染疗效