论文部分内容阅读
目前语音识别逐渐开始应用于嵌入式系统,例如手机、掌上电脑等各种移动设备,但是由于受到CPU运算能力和内存资源的限制,嵌入式系统上的语音识别大多还停留在中小词汇量的语音命令和控制,而非特定人连续语音识别由于具有较高的计算复杂度尚未在嵌入式系统上得到广泛的应用。在此背景下,该论文研究基于隐含马尔可夫模型(HMM)的嵌入式非特定人连续语音识别系统的实现及其性能优化。
该论文的主要工作如下:
1、实验研究了现有技术平台的性能瓶颈,揭示了语音识别的工作性能与计算资源的冲突所在,其中浮点运算能力是影响嵌入式平台上非特定人连续语音识别系统实时性的关键因素,算法定点化可以大幅提高系统的识别速度,但是仍然无法达到实时的要求,同时会带来识别率的下降;
2、设计并实现了一款基于MPC5200微处理器的嵌入式平台,该平台具备较强的浮点运算能力和充足的存储空间,并且支持音频输入输出。在该平台上实现了基于HMM的非特定人连续语音识别,可以实时处理中小词汇量的连续语音识别任务;
3、在嵌入式平台上实现了基于子空间高斯聚类的快速算法,进一步简化HMM模型的计算复杂度,回避了声学模型重新训练的问题,实验结果表明,系统识别速度提升20%以上,识别率基本保持不变,大大拓展了系统的词汇量规模;
4、提出了一种简单有效的特征分量贡献度的衡量方法,通过选择屏蔽特征矢量的各个分量,评价其对系统识别率的贡献,在识别过程中计算HMM模型的时候,屏蔽贡献度比较低的特征分量,达到降低计算复杂度的目的,实验结果表明,该方法可以将识别速度提升5%以上,而识别率基本保持不变。