论文部分内容阅读
该论文的主要工作如下:1、在实时嵌入式系统上建立了基于HMM的非特定人大词汇表连续语音识别的实验平台,分别进行了无文法约束的汉语全音节网络识别和乘出租车对话语句识别的基线系统的实验.2、提出了分段动态阈值剪枝快速搜索算法,利用语音帧在整个语音段所处的相对位置对路径数目和路径概率得分的影响,以及当前激活模型数目对剪枝阈值的影响,在识别搜索的过程中动态调整剪枝的阈值.在无文法约束的汉语全音节网络识别基线系统和乘出租车对话语句识别的基线系统上的实验结果表明,与传统剪枝搜索算法相比较,该算法在保持相同甚至略高的识别率的情况下,搜索时平均每帧产生的路径数目分别降低3.38%和8%以上,实时处理时间分别下降21.15%和10.18%以上,有效地加快了搜索速度,减少了内存空间消耗.3、提出了基于特征分量屏蔽的高斯概率快速算法.高斯概率计算是语音识别中进行算法优化时的首选对象.传统的优化方法利用矢量量化对声学空间进行聚类,该论文从特征系数分量贡献度这个新的角度,对高斯概率计算中的各特征系数分量进行筛选,只计算其中贡献度突出的特征系数分量的表达式.在乘出租车对话语句识别的基线系统上的实验结果表明,该算法将单高斯分布基线系统的计算时间下降10%以上,而识别率同时略升0.72%左右;将6高斯混合分布基线系统的计算时间下降6.71%以上,识别率只是略降0.07%,有效地减少了高斯概率计算量,提高了识别速度.该算法也能和剪枝搜索算法同时使用,在不同阈值下的计算时间能够再下降0.6%-2.6%,而识别率也获得0.2%-4%的提升,说明了该算法与其他的快速算法有着良好的兼容性.4、提出了基于有效高斯分布子集的高斯概率快速算法.传统的高斯概率快速算法需要重新训练声学模型以获得供计算的高斯分布子集,该论文直接对高斯分布进行模式聚类,形成有效高斯分布子集,并用子集元素加权和的形式来表征其余的高斯分布,无需再对声学模型进行训练.在乘出租车对话语句识别的基线系统上的实验结果表明,该算法能够将基线系统的计算时间下降17%以上,同时识别率略降1.3%左右,声学模型的存储空间也有所下降,有效地减少了计算复杂度和存储空间,同时识别率得到了良好的控制.