基于子词的嵌入式语音识别系统

来源 :清华大学 | 被引量 : 0次 | 上传用户:sungod123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人与人之间最为自然的交流方式,语音操作方式显然也是人机交互时的最佳选择之一。今天,无处不在的嵌入式系统不断地改变着我们的生活。由于很多嵌入式系统,尤其是近年来发展最为迅速的移动式、便携式系统,体积越来越小,传统的键盘输入会带来诸多不便。而语音输入因其自然性和便利性,必将取代键盘,成为一种主要的输入方式。 本文分析了嵌入式语音识别系统的发展历史和现状,指出具有更佳的应用灵活性和识别稳健性的基于子词的中、大词汇量系统,将会是嵌入式语音识别的一个重要的发展方向。而这类系统现阶段的主要问题在于系统识别率和内存量、功耗之间的矛盾。 本文设计并实现了一个嵌入式语音识别系统。在工作频率为100MHz,功耗低于150mW,DSP的数据RAM仅为56k字节的情况下,在0.18倍实时内实现600词的中文孤立词语音识别,并且词表可以任意改变,此系统达到了实用化要求,能够广泛应用于各类移动平台。 本文提出了一种多级搜索的识别框架,各级搜索可以最大限度的复用片上有限的内存资源,突破了嵌入式系统的内存瓶颈,同时也减少了识别时间。 在此识别框架下,本文通过研究特征空间线性子空间的类区分能力,选择最为有效的子空间,来降低声学模型的复杂度,从而达到减少系统识别时间的目的。通过对于各种特征选择和特征提取算法的研究和分析,本文提出了一种CCS-MLLT(易混类可分离度-最大线性似然变换)的特征空间压缩算法,并将这一算法应用到各级搜索的特征参数中,有效的降低了各级搜索中声学模型的复杂度。 为了解决内存瓶颈问题,本文通过研究状态模型相似度准则,对第一阶段声学模型进行状态共享处理。本文将Bhattacharyya距离和散度度量作为状态模型相似度准则引入到状态聚类领域。实验表明,采用这两种准则进行状态模型聚类后的系统,仍然能够获得稳健的识别性能。
其他文献
近年来,USB技术已经成为计算机领域发展最快的技术之一.它不仅在PC外围设备接口方面得到了广泛的应用,而且目前大量的通信设备厂商和消费类电子设备厂商都尝试着在自己的平台
随着IP业务流量的剧增,局部光网络链路出现拥塞的同时,网络中的其余链路却有可能存在空闲状态。随着技术的进步,运营商可以大量增加硬件资源,并且提高硬件的工作效率。不过仅
受激布里渊散射(SBS)具有自泵浦、实时产生相位共轭波、较理想地修正任意波前畸变等特点,目前已大量应用于成象畸变修正、激光光束质量改善、激光脉冲压缩、激光束并束等领域
近年来,国内市场对步进电机控制系统特别是微步控制系统的需求量逐年递增.然而市场上性能良好、成本低廉的步进电机微步控制器的匮乏制约着步进电机控制系统的进一步推广应用
激光核聚变的研究是人类解决未来能源危机以及改善环境污染的一项重大举措.该研究需要光机电等多学科的技术支持以保证高能激光束具有很好的光束空间特性.波前畸变的检测和控
静电放电保护电路设计问题是SOI CMOS可靠性设计中的一个重要环节之一.本文综合研究了当前SOI ESD保护技术发展的最新动态,并由此成功设计出适合于部分耗尽SOI的ESD保护电路,
土壤是个巨大的有机碳库,土壤碳库的微小变化可引起全球气候的显著变化。土壤呼吸是土壤释放CO2的过程,是土壤碳排放的方式之一。在占有全球陆地面积三分之一以上的干旱区,开展
该文利用改进的时域有限差分(FDTD)方法和伪谱时域差分算法(PSTD)分析计算目标电磁散射问题.所做工作包括四个方面:1)为了改善和提高传统FDTD方法模拟曲面导体的精确性,在对
随着经济技术水平的增长,电子技术逐渐占据了人们的日常学习和生活。人们对电子设备的要求越来越多,使得电路系统逐步趋于小型化和高精度。而时钟频率的提高,也使得传输线上
学位