基于VQ-HMM的汉语全音节语音识别系统的算法研究

来源 :北京航空航天大学 | 被引量 : 0次 | 上传用户:king1981001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文系统研究了基于矢量量化-隐马尔可夫模型(VQ-HMM)的汉语全音节语音识别问题,对这个问题的各个关键部分都作了细致的对比性研究并且提出了一些改进方法,在以下几个方面得到了性能改善结果:①改进的语音端点检测方法比传统的检测方法更抗噪、更准确;②采用Mel频率倒谱参数(MFCC)比线性预测编码倒谱参数(LPCC)能获得更高的系统识别率;③引入倒谱参数、差分倒谱参数以及能量参数能进一步提高系统识别率;④多码本量化使特征参数对语音的描述参力更详尽;⑤码本的充分训练需要大量语间资料,多级训练使码本训练速度更快;⑥具有凝聚共性的分段K平均HMM模型训练算法训练收敛速度快,计算量少,而且识别率并不比传统的Baum-Welch重估计算法低多少;⑦汉语各音节发音特点不同,因此其HMM模型的状态数也最好不同,采用差分极值点计数确定状态数,能使HMM模型对语音的描述更充分,系统的识别性能也更高.该项研究属于国家"863"计划项目、广东省自然科学基金项目以及广东省重点学科项目、五邑大学重点学科项目计划研究内容,得到了研究经费的资助.
其他文献
论文首先讨论了数据调制部分datapump的实现方案,重点研究了Transmitter与Receiver中关键算法,如均衡器、回波抵消器、非线性预编码器、QAM调制器等.论文的主要内容 是研究软
学位
该文首先介绍了MPEG--2系统层传输流的名法结构.其后介绍了DVB--C信道调制与解 调的基本原理和IC总线议.在此基础上提出一套DVB--C信道传输与接收的解决方案, 并在文章的最后
英语作为小学各教学科目中最为重要的科目之一,对于小学生的作用可谓不言而喻.随着社会各界对于小学生核心素养的要求的日渐提高,在小学英语课堂教学中,对核心素养的渗透也正
计算机口颌肌测试系统是华西医科大学口腔医学院正畸科提出一个医学与电子学相结合的课题.借助于现代电子测试手段,通过传感器将口颌肌对牙齿的压力转换为电压信号进行处理,
中枢神经系统(Center Nervous System,CNS)退行性变性疾病的主要病理变化是病变区域神经元的大量死亡。亨廷顿氏病(Huntington disease,HD)是以新纹状体损害为主的锥体外系病
该论文首先介绍了课题产生的原因、意义和可行性,然后分别介绍了课题中使用到的重要技术,一是AGP接口;二是微软的DirectX技术,着重介绍了与课题有直接关系的DirectX的一个组
芦荟是百合科(Liliaceae)芦荟属(Aloe)多年生常绿肉质植物,原产于非洲南部。芦荟喜温怕寒,因此,我国北方栽培的芦荟须在塑料大棚内越冬,而导致芦荟接受的光照强度减弱。本文以库
本文主要讨论了数字信号处理分系统的原理和实现。鱼雷运动时发射出线性调频信号,该系统可以测量此信号经过水下传播后接收信号相对于发射信号的时延值。本系统主要用来为测量
该论文主要对无人机数据链系统的方案设计过程进行了分析,编制出一套适用于设计过程进行了分析,编制出一套适用于远距离无要机数据链系统方案设计及分析的计算机软件.同进对