实时语音识别系统的快速算法研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:ivwsige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文的主要工作如下:1、在实时嵌入式系统上建立了基于HMM的非特定人大词汇表连续语音识别的实验平台,分别进行了无文法约束的汉语全音节网络识别和乘出租车对话语句识别的基线系统的实验.2、提出了分段动态阈值剪枝快速搜索算法,利用语音帧在整个语音段所处的相对位置对路径数目和路径概率得分的影响,以及当前激活模型数目对剪枝阈值的影响,在识别搜索的过程中动态调整剪枝的阈值.在无文法约束的汉语全音节网络识别基线系统和乘出租车对话语句识别的基线系统上的实验结果表明,与传统剪枝搜索算法相比较,该算法在保持相同甚至略高的识别率的情况下,搜索时平均每帧产生的路径数目分别降低3.38%和8%以上,实时处理时间分别下降21.15%和10.18%以上,有效地加快了搜索速度,减少了内存空间消耗.3、提出了基于特征分量屏蔽的高斯概率快速算法.高斯概率计算是语音识别中进行算法优化时的首选对象.传统的优化方法利用矢量量化对声学空间进行聚类,该论文从特征系数分量贡献度这个新的角度,对高斯概率计算中的各特征系数分量进行筛选,只计算其中贡献度突出的特征系数分量的表达式.在乘出租车对话语句识别的基线系统上的实验结果表明,该算法将单高斯分布基线系统的计算时间下降10%以上,而识别率同时略升0.72%左右;将6高斯混合分布基线系统的计算时间下降6.71%以上,识别率只是略降0.07%,有效地减少了高斯概率计算量,提高了识别速度.该算法也能和剪枝搜索算法同时使用,在不同阈值下的计算时间能够再下降0.6%-2.6%,而识别率也获得0.2%-4%的提升,说明了该算法与其他的快速算法有着良好的兼容性.4、提出了基于有效高斯分布子集的高斯概率快速算法.传统的高斯概率快速算法需要重新训练声学模型以获得供计算的高斯分布子集,该论文直接对高斯分布进行模式聚类,形成有效高斯分布子集,并用子集元素加权和的形式来表征其余的高斯分布,无需再对声学模型进行训练.在乘出租车对话语句识别的基线系统上的实验结果表明,该算法能够将基线系统的计算时间下降17%以上,同时识别率略降1.3%左右,声学模型的存储空间也有所下降,有效地减少了计算复杂度和存储空间,同时识别率得到了良好的控制.
其他文献
经典的相干分析是建立在信号平稳的假设基础上,反映两个随机过程在某一频率成分上的同步关系。在脑电研究领域,相干分析主要用于分析大脑不同区域活动的相关程度及驱动-响应
论文从多个角度详细的比较了H.323与SIP的优缺点,详细的剖析了SIP的消息结构以及各网络实体的工作原理。提出了WebUA,把HTTP与SIP结合在一起设计并开发了WebUA的REGISTER,INVITE
本文通过对荣华二采区10
期刊
  本文以IEEE802.11作为主要研究对象,对该协议关键技术进行了分析和研究,提出ICMIC混沌跳频序列应用于物理层实现的可能性以及基于多通道预约冲突避免的随机多址接入协议,并
  本论文研究了决策树算法中最为重要的一种ID3算法,并引入逻辑描述的概念,定义了基于逻辑描述的ID3决策树算法,在一定程度上改善了决策树合理生长的问题;然后,在决策树形成的大
为了给红外双波段探测系统的研制提供模型和仿真数据。本文分别对红外探测系统的目标辐射、光学弥散、探测器特性、运动成像进行了建模和仿真。研究了目标的空间采样、运动轨
本文在分析了语音信号的码激励线性预测编码(CELP)技术的基础上,对[TU-T提出的共轭结构代数码激励线性预测(CS-ACELP)算法及根据此算法所制订的G.729协议进行了研究。 针对
学位
本课题来源于国家高技术研究发展计划(863计划)子课题《稻麦品质与生理特征光谱的研究与应用》。研究的意义是探讨在使用高光谱数据预报冬小麦品质数据中,三维数据模型的可行
多年生黑麦草(LoliumperenneL.)是一种应用广泛的禾本科牧草和草坪草,在世界各地的温带地区均有分布,适宜在我国北方大部分地区种植。黑麦草喜欢温凉湿润的气候,其个别品种具有