基于GPU的并行巩膜识别与LDPC译码研究

来源 :西安电子科技大学 | 被引量 : 2次 | 上传用户：xjj

【摘要】

：

低密度奇偶校验码(Low Density Parity Check,LDPC)的纠错性能能够达到Shannon极限,但其译码算法计算量大,计算时间长。巩膜识别是新兴的生物识别技术,在可见光条件下的识别

【作者】

：

蔺勇

【出处】

：

西安电子科技大学

【发表日期】

：

2014年01期

【关键词】

：

并行计算 GPU 巩膜识低密度奇偶校验码非规则问题

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

低密度奇偶校验码(Low Density Parity Check,LDPC)的纠错性能能够达到Shannon极限,但其译码算法计算量大,计算时间长。巩膜识别是新兴的生物识别技术,在可见光条件下的识别性能优于虹膜识别,但因其匹配算法计算密度大、耗时长,从而难以应用在实时环境中。LDPC译码和巩膜匹配都属于多数据集上的非规则问题(Irregular Problem on Massive Datasets,IPMD),这类问题需要在不同数据集上进行重复计算,且同一数据集内待处理数据元素的索引与循环变量不具有线性关系。采用GPU(Graphics Processing Unit)能够加速IPMD计算,但在算法设计中也面临着一些挑战,这些挑战主要来自三个方面:首先,由于数据空间局部性较差,数据集内难以划分为独立子块;其次,子任务及其组合到GPU计算资源之间不易找到最优映射;第三,数据访问地址不规则导致无法进行合并存取。本文在研究GPU并行算法分析模型的基础上,针对上述问题分别提出解决方法,并将这些方法应用到LDPC译码和巩膜识别的GPU并行计算中。本文的主要贡献有:1.在GPU并行算法分析方面,针对GPU部件(CUDA core,SFU和LD/ST)间并行、部件内采用流水线的工作方式,通过源码分析,利用DAG图化简隐藏并行指令,设计了多部件流水线的基本分析模型。采用就绪Warp数、合并存取、同步、程序分支等九个因子对基本模型进行校准,使分析模型既能够量化反映硬件约束,又能够充分体现GPU内兼有指令并行和Warp并行的特性。应用所设计的分析模型,对LDPC译码的三种算法进行了分析,得出SPA算法在GPU译码中性能最优的结论。2.在IPMD并行算法设计方面,提出了多级并行的算法设计方法,该方法的内容主要包括:多数据集上的计算并发执行;同一数据集中的计算限定在一个Block内;采用同步指令对计算任务进行分块;在任务块内进行子任务划分和循环边界确定。分析指出能够采用多级并行的IPMD问题应满足两个条件:多数据集应能保存在外存储器中;单个数据集上的计算时间要足够小。结合巩膜匹配算法,研究了使IPMD满足这两个条件的方法,即设计Y描述符以减少计算量,设计WPL描述符以降低存储空间占用。3.在任务组块和映射方面,针对不同的GPU任务需求,设计了三种GPU并行任务组块和映射模型:任务均衡模型、可同步模型以及合并存取模型,分析了这三种基本模型及其变形的映射方法和适用条件。将这些模型应用到巩膜匹配的四个阶段,通过在每个阶段应用不同的组块映射模型,使巩膜匹配计算全过程达到了任务均衡,并使访存和同步开销降到了最低。4.在提高IPMD访存速度方面,提出了加速全局存储器访问的方法:一是用较少的信息位量化编码原有信息,实现数据压缩;二是通过多组数据并行实现合并存取。其中合并存取的实现主要通过映射一组大小与Warp相等的数据集到同一Warp,从而使Warp内原本无序或随机的访问地址能够被有序访问。设计了校验似然比的LDPC译码算法中,降低了8位定点数表示更新信息时产生的量化错误。以上模型和方法应用到巩膜匹配和LDPC译码后,巩膜匹配速度由每秒匹配2个提高到每秒匹配1,083个,使得巩膜识别这一新技术的实时应用成为了可能。基于GPU的LDPC译码器吞吐率达到了550Mbps,是目前单块GPU上译码速度最快的LDPC译码器。

其他文献

综合治疗腱鞘囊肿187例疗效分析

腱鞘囊肿是临床常见病，以局部胀痛及腕力减弱为主要特征，多见于手腕、足背肌腱或关节附近。既影响美观，叉给腕关节活动带来不适。我们近几年来采用小针刀配合药物（曲胺奈德）治疗腕

期刊

腱鞘囊肿综合治疗

多用户通信系统中编码协同技术研究

协同通信融合了分集技术与中继传输技术的优势,利用多个参与通信的实体之间的协作来共享有限资源,可有效地提高无线资源的利用率。编码协同将编码技术与分集技术结合应用于协

学位

编码协同中继协同编码乘积码信号空间分集多维映射联合网络-喷泉编码

基于障碍物智能识别的人机融合汽车安全预警研究

随着我国国民经济的快速增长,拥有汽车的人也越来越多,汽车给人们的出行带来了很大方便。然而与此同时,交通事故也呈高速增长趋势,因交通事故造成的损失也令人心痛,因此汽车

学位

汽车防撞障碍物识别雷达散射截面安全距离人机融合

成年人肾透明细胞肉瘤1例及文献复习

患者女，34岁，因右侧腰部疼痛20天，检查发现“右肾肿瘤”15天，于2008年12月15日入院。该患20天前无明显诱因出现右侧腰部钝痛，向同侧腹部放散，超声检查显示右肾中部一实质性回声，大小

期刊

肾透明细胞肉瘤文献复习成年人实质性占位性病变腰部疼痛超声检查无肉眼血尿肾肿瘤

苦豆子种子多糖与黄原胶的协效性研究

对苦豆子(Sophora alopecuroides L.)种子多糖(苦豆子胶)与黄原胶的协效性进行了研究、结果表明，不同配比的苦豆子胶与黄原胶混合后，其协效性不同，其中苦豆子胶与黄原胶的重量比

期刊

苦豆子苦豆子多糖(苦豆子胶)半乳甘露聚糖黄原胶协效性Sophora alopecuroidesL.polysaccharide from sophor

人参二醇组皂苷对内毒素休克大鼠肾脏TLR2和TLR4mRNA表达的影响

目的通过观察内毒素休克模型大鼠肾组织中TLR2和TLR4及IκBαmRNA表达变化及人参二醇组皂苷（PDS）对其的影响,探讨内毒素引起肾脏损伤的机制。方法 40只雄性Wistar大鼠随机分为

期刊

内毒素肾脏TLR2TLR4人参二醇组皂苷endotoxinkidneysTLR2TLR4panaxadiol

打造重大题材畅销书的五个“实”——以《习近平的七年知青岁月》为例

讲好党的故事是新时代新闻工作和党史工作的共同要求。《习近平的七年知青岁月》采访实录,是用口述史的方式讲述党的领袖成长之路的一次成功尝试。本文从五个'实'出

期刊

重大题材畅销书贴近群众

超宽带脉冲网络和天线的特性表征与设计应用

随着超宽带通信技术的快速发展和瞬态电磁理论研究的逐渐深入,超宽带电磁脉冲逐渐成为一个新的研究热点,对完善和丰富电磁理论和超宽带应用技术有重要的意义和价值。然而,传

学位

超宽带脉冲信号脉冲网络传输特性脉冲天线辐射特性特性表征时域分析欧氏距离最佳脉冲传输描述矩阵低阻抗槽线

基于高程和钟差辅助的卫星导航接收机定位技术研究

可用性即接收机提供连续定位服务的时间百分比,是卫星导航系统的关键性能指标。在实际应用条件中,遮挡可能导致卫星数不足四颗无法定位,弱信号情况下无法获取完整卫星信号发

学位

卫星导航系统可用性弱信号信号发射时间恢复高动态首次定位时间

基于GPU的并行巩膜识别与LDPC译码研究

其他学术论文