基于图形处理器及缓存技术的语音识别系统优化研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:ekinhushuang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术作为计算机科学领域的一个研究热点,有着深刻的理论研究意义和巨大的商业应用潜力。尤其是近年来,随着技术的革新,大词汇量连续语音识别任务已成为语音识别技术中最具有实际应用价值的任务之一。   语音识别系统的识别速度是影响语音识别系统实用化的关键因素之一。图形处理器(Graphic Processing Unit,GPU)在近些年来发展迅速,其计算能力已经远优于CPU。因此,本文使用图形处理器计算高斯混合模型似然得分,加快声学模型得分运算,在不影响识别性能的前提下,使得识别速度平均提高20%左右。   基于加权有限状态转换器(Weighted Finite State Transducer,WFST)的语音识别解码器已广泛应用于语音识别的研究中。而WFST搜索网络是由声学模型、语言模型以及发音词典组成的搜索网络,使得内存占用量很大。本文利用缓存技术,将完整的WFST搜索网络置于硬盘中,仅将识别过程中需要的部分读入内存,使内存和硬盘协调工作,有效地降低了内存占用量。采用较小规模的语言模型时,缓存技术使得内存占用量降低了60%~80%,代价是识别速度降低5%左右;采用较大规模的语言模型,由于内存限制,基线系统无法正常工作,缓存技术优化后的系统依然能够快速有效地完成识别任务。
其他文献
研究地球表面各种物体电磁波辐射特性是遥感技术的一项极重要的基础,而对这些特性的提取和保存成为更加艰巨的任务,也是推动遥感技术发展必不可少的工作。用光谱信息实现地物识
烟叶腺毛和腺毛分泌物与烟叶香气质和香气量的形成关系非常密切。通常腺毛密度大、发育状况好及腺毛分泌物多的烟叶香气浓郁、纯厚、饱满。研究不同品种烤烟在生长过程中腺毛
学位
空气中氡对人体健康的影响已经引起广大公众的广泛关注,对氡的监测和防护成为多学科共同关心的问题,所以研制高效、稳定、准确的测氡仪是关键。α能谱测氡仪以其精确性强,适
学位
地名与时间信息是描述事件背景内容的两个关键信息。正确地识别地名与时间表达式,将有助于中文分词、未登录词识别、命名实体识别等处理性能的提高。同时,这一工作也是信息检索
学位
摘要:写作能力是学生语文素养的重要组成部分,也是衡量其語文水平的一个重要标准。新课标7至9年级阶段目标中把写作和识字与写字、阅读、口语交际及综合性学习并列为五大目标。本文着重从作文教学的做法来谈论培养中学生写作能力的方法。  关键词:初中语文;写作;观察  一、精心选材立意,巧妙布局谋篇  话题作文,写作范围一般都十分宽泛,但要想作文出彩,第一点要求就是善于在一个宽泛的范围内,“择其一点,不及其余
近年来基于图论的图像分割方法因其简单的结构、丰富的理论支持,成为了学者们研究的热点。EGB算法是其中一种具有代表性的快速高效、基于最小生成树的分割方法,可以获得符合全
本文通过对荣华二采区10
期刊
小麦白粉病是中国各个麦区的重要病害。对白粉菌群体的毒性频率的调查有助于在育种中合理利用抗病基因。本研究收集并分离鉴定了南京地区小麦白粉菌生理小种,分析了病原群体中毒性基因的频率,同时还对本实验室收集和保存的二倍体、四倍体小麦进行了抗性鉴定。从33份小麦白粉菌菌株中,鉴定出了21个生理小种,其中1号优势小种出现频率为12.1%。各小种中所含已知毒性基因数目从5到14不等,抗性鉴定表明Pm3c和Pm5