基于HTK的衡阳方言语音识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:fredric_cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是人机交互最简单直接的方式,它是一门综合性学科,涉及语言学、模式识别、人工智能等一系列学科,具有非常广泛的应用前景。近年来,随着信息科技的发展,汉语语音识别已经取得了一定的研究成果,并逐渐应用到实际产品中。但是,要想使语音识别技术真正的走进人们的生活之中,还存在着很多问题。由于中国的地域性差异使得十里不同音,针对各地方言的识别研究也变得尤为重要。本文对湖南省衡阳市衡阳方言进行了研究,建立了基于隐马尔科夫模型(HMM)的衡阳方言连续语音识别系统。在文中,简要介绍了语音识别的系统结构和识别方法,深刻分析了语音的声学特征,并对衡阳方言的特点进行了研究。重点研究了特征参数提取的基本原理和方法,并对隐马尔可夫模型进行了深入的研究。首先,研究了衡阳方言的特点,衡阳方言在发音方面与汉语普通话存在较大的差异,要想建立一个高性能高质量的语音识别系统,就需要对衡阳方言进行深入的研究。本文利用隐马尔科夫模型工具箱(HTK3.4.1),结合汉语所特有的声韵母的发音方式,以音素为基本识别单元,分别采用线性预测倒谱系数(LPCC)和梅尔倒谱系数(MFCC)进行特征提取,基于5状态的HMM模型,搭建了衡阳方言连续语音识别系统。设计实验比较了在不同的音素模型、不同的特征参数以及不同的高斯混合数(Mix)下系统的识别性能。实验表明了在39维的MFCC参数,高斯混合数为6,基于绑定状态的三音素模型下,系统的识别性能达到最佳。并在此基础上对系统进行了测试,测试结果表明,系统在实际的环境中具有一定的自适应性,识别率较好。
其他文献
1前言在化工生产中,最终产品或中间产物往往需要冷却至安全温度后送至贮罐或下一道工序。冷却物料需利用冷却器,而列管式水冷器由于其具有紧凑、坚固,且能选用多种材料制造,适应性
本文结合县域经济发展的一般理论,根据贵州资源禀赋和经济发展水平,提出了资源带动型、产业承接型、旅游资源带动型和农业产业化带动型四种发展模式。
局部晚期的膀胱移行细胞癌患者,在膀胱全切后有较高的复发危险。作者应用原位杂交技术和膀胱全切术后的石蜡标本,研究了6 4例随机接受新辅助化疗(氨甲蝶呤,长春碱,阿霉素,顺
中小城市的连锁超市存在配送中心不健全、运输成本过高、占用资金过多、信息系统不完善、专业技术人员缺乏等问题,从而导致连锁超市的物流成本过高,降低了超市的竞争力,因此
急诊科是医院的重要组成部分[1],是医院为病人全天候开放的“生命通道”,是一个病人病情重、突发事件多、工作量大、医患纠纷多、风险大的科室.对医护人员的要求高,因此急诊
目的了解新生儿肠道病毒感染脑炎患儿的临床特征。方法回顾性分析我院新生儿科2016年4月~2017年7月收住的13例新生儿肠道病毒感染脑炎患儿的临床资料。结果所有患儿临床表现
新建徐盐(徐州—盐城)高速铁路盐城车站地层复杂,采用水泥土搅拌桩予以地基处理时,常规工艺施工的试验桩上部施工质量差,下部施工质量好。结合工程地质情况及施工工艺,提出在
草木染,“出方有土,采以时月”。用从山野植物萃取出染料染就的产品质朴、纯净、美好,凝聚着独特的东方美和天人合一的中国古典哲思。它有着悠久发展的历史,是中华民族长久以
人工髋关节置换术后护理非常重要,必须要调查资料、做好术前评估、确定护理问题、实施护理措施,术后护理观察病情及康复指导。本文通过对髋关节置换术后护理的分析,降低患者
在兰州至中川机场城际铁路建设中采用水泥掺量为12%,16%,20%的水泥土搅拌桩进行地基处理并观测其沉降,运用双曲线法、三点法、Asaoka法预测复合地基的沉降,研究水泥土搅拌桩