非特定人孤立词语音识别系统的研究

被引量 : 0次 | 上传用户:yesterday23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为一个交叉学科,具有深远的研究价值。语音识别和语音合成技术已经成为现代技术发展的一个标志,也是现代计算机技术研究和发展的一个重要领域。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但是,大多数语音识别系统仍局限于实验室,远没有达到实用化要求。制约实用化的根本原因可以归为两类,识别精度和系统复杂度。 本文针对汉语语音识别面临的理论和技术问题,研究了汉语语音识别技术及其实现方法。 论文首先分析了语音信号预处理问题。对端点检测算法进行了部分改进,提出了一种动态双门限端点检测算法。对MFCC倒谱系数在语音识别中的运用做了详细介绍。 其次研究了基于DTW的语音识别系统,针对DTW算法中系统识别性能过分依赖于端点检测、动态规划的计算量太大等缺陷,分别提出了快速DTW算法和端点松动的DTW算法,仿真结果比较理想。 继而研究了基于HMM的语音识别系统。针对HMM在实际应用中的优化计算问题,包括初始模型选取,定标等进行了深入的分析与探讨。针对传统定标仍能溢出的问题,给出了无溢出的参数重估公式。研究了基于“矫正训练算法”的非特定人DHMM识别系统,并进一步把该算法推广到非特定人CHMM识别系统中。仿真结果显示识别率有一定的提高。 论文建立了一个由11人组成的语音数据库,包括数字0~9,“西”、“南”、“交”、“通”、“大”、“学”共16个样本元素,528个发音。本文所有的仿真试验数据均来自该数据库。论文最后探讨了C++与MATLAB的混合编程问题,并用之于HMM模型训练。既提高了程序的运行效率,同时也为全部用C++编程提供了参考。
其他文献
新医改方案明确提出医药卫生事业关系亿万人民的健康,关系千家万户的幸福,是重大民生问题。健康管理这个从国外引进的新概念,伴随着时代的发展应运而生,是防治疾病的有效途径
报道了采用强酸性阳离子交换树脂为催化剂,甲基丙烯酸和甲醇气-液-固三相连续反应高酯化率合成甲基丙烯酸甲酯的反应条件和阻聚方法。采用连续三相固定床反应器、大孔阳离子
本文结合国家经贸委“多功能路面清雪车”项目,针对一直以来困扰人们的新降雪及时清除问题,进行多功能清雪车侧雪铲(简称侧铲)的研究工作。主要研究内容如下:(1)了解机械清雪
第一章绪论,本章重点对于行政复议与行政诉讼衔接制度问题研究的动机、研究的目的以及研究的方法加以说明。行政复议与行政诉讼制度,都是对人民受行政权侵害的救济,两者目的
焦点解决模式提倡用积极的、发展的眼光看待当事人,把解决问题的关注点集中在正向方面,寻求最大化地挖掘个体的力量和优势,具有较强的可操作性,对问题学生的教育引导,颇具启
<正>曼陀罗是梵语的音译,它的本意是"圆形"或"中心",主要以圆形或方形为主,圆形代表宇宙,方形代表地球与人类世界。在东方佛教徒及西方牧师、巫师的眼中,曼陀罗图形可作为一
建立信任管理机制对于确保P2P网络中用户的利益,确定资源或者服务的有效性具有重要意义。阐明了P2P网络信任管理中的基本概念,剖析了P2P网络信任管理系统的基本组成及各个部
延迟折扣任务是一种决策行为,被试在具有时间与数量两个维度的奖赏之间进行选择。在延迟折扣任务中,延迟的奖赏的主观价值随延迟时间的增长而下降称为延迟折扣,它符合双曲线
目的:探讨粥样硬化的冠状动脉、原发性高血压(EH)和房颤左心的几何与功能重塑及其相关因素。方法:一、以血管内超声检测粥样硬化冠脉,测量血管总面积(TVA)、管腔面积(LA)、管
本文为了在鄂尔多斯西缘上古生界低孔低渗储层的背景下预测相对高孔高渗储层,采用地质资料与测井评价相结合,对相对高孔隙带和裂缝发育带进行评价,分析了不同地区的它们的成因联