嵌入式非特定人连续语音识别系统研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:bear81
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前语音识别逐渐开始应用于嵌入式系统,例如手机、掌上电脑等各种移动设备,但是由于受到CPU运算能力和内存资源的限制,嵌入式系统上的语音识别大多还停留在中小词汇量的语音命令和控制,而非特定人连续语音识别由于具有较高的计算复杂度尚未在嵌入式系统上得到广泛的应用。在此背景下,该论文研究基于隐含马尔可夫模型(HMM)的嵌入式非特定人连续语音识别系统的实现及其性能优化。 该论文的主要工作如下: 1、实验研究了现有技术平台的性能瓶颈,揭示了语音识别的工作性能与计算资源的冲突所在,其中浮点运算能力是影响嵌入式平台上非特定人连续语音识别系统实时性的关键因素,算法定点化可以大幅提高系统的识别速度,但是仍然无法达到实时的要求,同时会带来识别率的下降; 2、设计并实现了一款基于MPC5200微处理器的嵌入式平台,该平台具备较强的浮点运算能力和充足的存储空间,并且支持音频输入输出。在该平台上实现了基于HMM的非特定人连续语音识别,可以实时处理中小词汇量的连续语音识别任务; 3、在嵌入式平台上实现了基于子空间高斯聚类的快速算法,进一步简化HMM模型的计算复杂度,回避了声学模型重新训练的问题,实验结果表明,系统识别速度提升20%以上,识别率基本保持不变,大大拓展了系统的词汇量规模; 4、提出了一种简单有效的特征分量贡献度的衡量方法,通过选择屏蔽特征矢量的各个分量,评价其对系统识别率的贡献,在识别过程中计算HMM模型的时候,屏蔽贡献度比较低的特征分量,达到降低计算复杂度的目的,实验结果表明,该方法可以将识别速度提升5%以上,而识别率基本保持不变。
其他文献
本文通过对荣华二采区10
期刊
视网膜血管形态结构具有唯一性,没有相重性,因此其生物特征具有很高的保密性和防伪能力等应用价值。另一方面高血压动脉硬化、冠心病、慢性肾炎等是中老年人常见疾病,会引起视网
本文选题来源于国家973项目"面向功能可重组结构的DSP&CPU芯片及其软件系统的基础研究"(课题编号:G1999032900)该项目组包括硬件系统和软件系统的研制.硬件系统包含DSP&CPU总
本论文构造仿真数据,模拟回波,并采用蒙特卡罗分析方法,对雷达信号检测和恒虚警检测从理论公式与蒙特卡罗实验两方面分析。同时利用雷达恒虚警检测的蒙特卡罗实验结果进行了
现代高性能芯片的设计和制造工艺的发展促进了测试仪器的进步和变革.本论文通过对现代集成电路测试仪、微处理器测试技术和可编程逻辑器件的分析和研究,设计出一种经济实用的
学位
论文综述了通信系统和智能天线研究的进展,着重阐述了使用智能天线实现信号到达波方向估计的各种算法,在此基础上开展了信号到达波方向的信号处理技术的研究。本文主要贡献和创
Ad hoc网络是一种工作在无固定结构环境下的自组织的无线移动网络。它适用于军事或是一些战略应用场合,例如,战场上部队快速展开和推进、发生地震或水灾后的营救等。在没有网络
在人机语音交互的实际应用中,计算机处理的实际信号除了包含目标语音信号以外,还常常包含噪声信号或干扰语音信号或噪声信号与干扰语音信号二者兼有,导致语音识别的可用性急剧降
人脸识别是模式识别领域的一个重要研究课题,也是目前生物识别技术的一个热门研究方向。它可以这样描述:对于输入图像或视频流,首先判断其中是否存在人脸;如果存在,则提取每个人脸