【摘 要】
:
语音识别一直都是国内外的一个重要的研究课题。目前的语音识别系统对发音人的语速具有一定的自适应调整能力。但对于不同的发音人来说,这些自适应调整能力都是不够的,往往在
论文部分内容阅读
语音识别一直都是国内外的一个重要的研究课题。目前的语音识别系统对发音人的语速具有一定的自适应调整能力。但对于不同的发音人来说,这些自适应调整能力都是不够的,往往在识别那些语速过快或过慢的语音的时候,得到的识别率都比较低。
本文从研究语音识别的一些基本理论入手,为了改善语音发音长短不同,而导致识别率下降的问题,重点研究了基于HMM模型以及动态时间规整算法的元音长度调整算法和元音分组算法,并进行了仿真与比较。本文的主要研究工作如下:
1.本文先对隐马尔可夫模型(Hidden Markov Model,HMM)和动态时间规整算法(Dynamic Time Warping,DTW)进行了详细的分析,并对基础模型、算法进行了仿真实验。将基于DTW算法的仿真结果,作为后续章节研究的基础识别率,从而可清晰地看出改进算法对识别率的提高。
2.根据汉语语音发音时,每一个音节都含有元音,元音长度占音节长度的主要部分,但是却不包含发音的主要信息这些特点,研究了在语音的元音部分,利用相关系数寻找相似波形,然后对元音部分进行相似波形的插入或删除的方法,来改变元音部分的长度,进而调整语速。在对元音部分进行实际操作时,提出了一种新的计算方法,相对于原先的“调整-判断-再调整-再判断”方法,在算法速度上有了很大的提高。
3.由于元音长度调整算法当中,阈值参数Lmax和Lmin的取值,不能完全兼顾到所有的孤立词。本文提出了一种改进算法,即元音分组算法。该算法使用三种分组方法,分别根据元音的类型、元音的相似性以及元音的长度进行分组。针对不同的元音组,选择不同的阈值参数Lmax和Lmin,真正做到“区别对待”。仿真实验结果表明,相较于元音长度调整算法,这种改进的算法对系统的识别率,有更为显著的提高。
其他文献
现代数字通信系统的快速发展日益朝着增大信息容量,提高信道的频谱利用率以及提高系统线性度的方向发展,研究功率放大器的线性化技术对提高系统的线性度具有重要意义。
本
激光通信具有信息量大,传递路数多,方向性强,保密性好等优点,在军事、国防、民用等各个领域有着广泛的应用前景。本论文以大气激光通信为应用背景,设计了一套完整的应用于大
基因表达过程中存在基因之间相互作用、相互调控的行为。单个基因表达的研究不能揭示生命现象的内在规律,这就需要从系统的角度研究基因表达。随着高通量DNA微阵列技术的发展
鸡传染性支气管炎(Infectious bronchitis,IB)病毒血清型众多,且不断出现新的变异株,疫苗免疫后鸡群发病现象仍时有发生,给养禽业造成巨大的经济损失.本文对免疫失败发病的疑
数字水印技术是一种极具潜力的数字作品版权保护技术。数字音频水印是数字水印中的一个重要研究方向。针对数字音频水印的研究,国内外已经提出了各种算法,但是关于音频水印的
研究表明,苯乙醇苷是管花肉苁蓉中最主要的活性成分,具有抗氧化、防衰老等广泛的药理作用,开发前景广阔。本文主要研究管花肉苁蓉中苯乙醇苷的提取纯化工艺优化以及其抗氧化活性研究。主要研究结果如下:(1)结合使用单因素试验、正交设计和响应面法优化,研究乙醇浸提法提取管花肉苁蓉中苯乙醇苷时提取时间、提取乙醇浓度、提取温度、料液比的影响,建立一个总的苯乙醇苷得率与影响因子的多元二次回归方程,并依此确定苯乙醇苷
寄生虫与宿主是一种捕食与被捕食的关系,宿主消化道内的寄生虫在鱼类食物网中的传播主要依靠宿主间的捕食作用,“寄生虫-宿主”关系对生态系统中的食物网的复杂性和稳定性有着
球形棕囊藻是我国沿海常见的有害赤潮种,其频发爆发的赤潮造成了严重的经济损失和生态危害。球形棕囊藻有着复杂多形态的生活史,它可在自由形态的单细胞和凝胶状的囊体中交替转换。而棕囊藻的囊体形成在赤潮的发生与发展过程中起到十分重要的作用。在自然海区中,棕囊藻赤潮通常季节性地发生在硅藻赤潮之后。因此研究硅藻与棕囊藻成囊关系对于揭示棕囊藻成囊作用以及棕囊藻赤潮的防治有着重要意义。本文对我国广西北部湾海区,球形
近年来环境污染问题已成为最受关注的问题之一。水体中重金属污染是一种持久性的,在生物体食物链中有比较明显的生物富集的一种水体污染。因此探究重金属富集的方法及原理,快速
当今,信号处理的任务大多是由数字电路来实现的。随着数字集成电路的速度和集成密度的高速增长,对连接模拟和数字世界的模数转换器(ADC)的精度和速度也提出了更高的要求。采样