基于声道共振的动态声学模型研究及其应用

来源 :北京大学 | 被引量 : 0次 | 上传用户：cangzhe

【摘要】

：

声学模型在语音识别与语音合成系统中起着重要的作用。目前主流的声学建模方法大多利用谱特征并基于隐马尔科夫模型(Hidden Markov Model-HMM)框架对语音的声学观察进行统计

【作者】

：

张志平

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2010年期

【关键词】

：

声道共振语音识别语音合成说话人转换动态声学模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声学模型在语音识别与语音合成系统中起着重要的作用。目前主流的声学建模方法大多利用谱特征并基于隐马尔科夫模型(Hidden Markov Model-HMM)框架对语音的声学观察进行统计。然而这种建立在谱特征空间中的声学模型难以体现出语音在发音层面上的动态特性以及各个隐状态之间的内在关联，导致模型状态冗余，推广能力和灵活性较差。为此，一些研究者提出了隐式声道共振建模思想，即以声道共振参数作为模型参数来描述发音过程，而计算观察概率时，将这些参数转换为谱参数，再与谱特征观察进行似然比较。　　本文研究中提出了一种基于HMM框架的隐式声道共振模型。模型在有限状态空间中对语音动态过程进行建模，与前人在相关研究中基于连续状态空间的建模方式相比，模型结构更加简单，计算复杂度更低。该模型对语音中的元音段和辅音段采取了不同的建模方式，分别用于体现声道形状变化的连续特性和暂态特性。对于元音段，相应的模型状态通过声道共振参数来表示。其中表示元音音位目标和元辅音音渡目标的状态被定义为目标状态并相互独立。在目标状态之间则通过插入过渡状态来体现发音过程的连续性和状态之间的相关性。对于辅音段，相应的模型状态则直接通过谱参数来表示，并与上述元音状态相联接，共同用于表示连续语流。通过改进的Baum-Welch算法，以及一些有针对性的训练策略，模型参数可以由语音数据学习得到，各个状态的训练结果也体现出了一定的发音意义。　　本文将所提出的隐式声道共振模型应用于语音识别和语音合成系统中。在面向汉语连续语流的识别系统中，文中针对这种声学模型的特点设计了相应的识别解码器。通过实验表明，与传统声学模型相比，本文所提出的声学模型可以有效地降低识别系统的错误率，对提高系统性能起到了很大作用。　　在面向语音合成的应用中，基于这种隐式声道共振建模思想和训练方法，可以对倒谱和共振峰动态特征建立状态同步的声学模型，用于对现有的HMM语音合成技术进行改进。实验表明，在小数据量训练语料情况下，基于倒谱声学模型合成语音的共振峰轨迹与真实语音相差较大，而基于这种新型声学模型合成的共振峰轨迹与真实语音更为相符。在大数据量训练情况下，两种模型合成的共振峰轨迹基本一致，新模型的合成结果更加平滑，可用于对语音的音色调节。　　通过以上研究表明，由于隐式声道共振模型能够更好地刻画语音的动态结构，因此该模型在提高语音识别和语音合成系统性能方面体现出一定的优势，并将在未来的应用中展现出更大的潜力。

其他文献

韩光辉摄影作品

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

摄影作品韩光辉

学校教学管理系统触摸屏终端指纹识别登录技术研究

作为生物识别技术的指纹识别技术的应用,是近年来研究和应用较热的一门古老而新颖的技术。由于指纹具有人类个体特征的唯一性,随着电子技术和计算机科学技术的迅猛发展,指纹

学位

教学管理指纹识别类点集匹配算法汗腺孔提取

浅析如何运用激励手段促进初中生数学学习效率的提高

摘要：激励是指激发人的动机的心理过程，通过激励使人在某种内部或外部刺激的影响下，始终维持在一个兴奋的、积极状态之中。心理学研究成果表明，动机是在需要刺激下直接推动人进行活动的内部动力，课堂教学不在于传授，而在于激励和唤醒。本文从实际出发，结合初中数学教学要求，从多方面探讨如何有效开展激励教学，促使学生学习效率提高。　　关键词：初中数学；激励手段；学习效率；提高　　对于初中生来说，数学学科相对于其他

期刊

初中数学激励手段学习效率提高

基于STAP的天基雷达动目标检测技术研究

本文主要研究基于空时二维自适应处理(STAP)方法的天基雷达动目标检测技术。本文首先介绍了天基雷达的杂波特征,包括杂波模糊、地球自转对杂波的影响,杂波的非平稳特性以及平

学位

天基雷达杂波建模空时二维自适应处理动目标检测降维杂波模糊抑制

守时系统用户信号监测方法研究与软件设计

守时系统是授时服务的基础和核心。守时系统在产生和保持我国授时时间标准UTC(NTSC)的同时,还要产生大量物理的标准频率用户信号和标准时间用户信号,为各类应用提供时间频率

学位

标准频率用户信号标准时间用户信号参考尺度检错和修正算法

基于多级信元排序的交换架构研究

学位

八种药用植物化学指纹图谱的初步研究

中药指纹图谱已成为国际公认的控制中药内在质量的有效手段，其应用研究对我国实现中药现代化、推进中药走向世界具有非常重要的现实意义。本文着重选择了峨眉山自然保护区的八种常见药用植物——何首乌、金银花、女贞子、虎杖、过路黄、萹蓄、吴茱萸和川芎。以其为研究对象，分别进行了高效液相色谱条件的探索，详细考察了其药用部分的色谱分离条件，包括供试品溶液制备、参照物的选择、色谱条件(色谱柱的选择、流动相的选

学位

高效液相色谱法指纹图谱中药

认知无线电在无线通信侦察中的应用研究

近年来，认知无线电(Cognitive Radio，简称CR)的新频谱使用模式逐渐受到人们的关注。在不对拥有频谱的授权用户或非授权用户产生有害干扰的前提下，认知用户可通过择机(opportunis

学位

认知无线电通信侦察分析平台频谱感知特征检测频谱使用模式

风力发电存在的问题与发展策略

本文通过对荣华二采区10

期刊

基于Linux的喷码机控制系统的关键技术研究

随着社会经济的不断发展,企业对条码印制的质量、速度、效益的要求日益提高；喷码技术广泛应用在产品质量管理、物流追踪和产品防伪等方面；喷码技术的应用正逐步深入每一个行业,

学位

嵌入式LinuxARM微控制器喷码机控制系统FPGA协处理器QtEmbedded4图形控制界面

基于声道共振的动态声学模型研究及其应用

其他学术论文