语音识别软件关键技术的研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:zp_3000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别字面上理解就是可以让计算机或者其他机器听到人所说的话并且做出一定的判断,本质上来说它属于模式匹配,它的根本目的就是要研究具有听觉功能的装置,让其通过语音的输入,理解说话人的意图并做出与命令相对应的响应。语音识别是一门很复杂的交叉性学科,涉及到语言学,声学,计算机科学,生理学,数字信号处理学等等学科。本文在系统分析了网络中开源的语音识别程序、语音信号分析和动态时间规整算法原理的基础上,针对特定词特定人的模式匹配构建了一个具有简单功能的语音识别系统。论文主要内容包括:首先简单介绍了语音识别的基本概念和算法原理及少量系统处理模块,国内外语音识别发展的历程和研究现状,阐明了本论文的研究背景和意义。分析语音识别系统的特点、结构和类型,以及语音识别应用所面临的问题,粗略介绍了目前比较运用较广的几种算法。根据本文语音识别系统自身所用的读入方式,介绍了音频格式,其中,详细介绍了 WAV格式音频文件的存储原理和文件格式。研究了语音信号的产生模型、数字化与预处理、在时域和频域中得到并分析音频信号的特征参数。详细介绍了 DTW(动态时间规整)算法以及对算法进行改进。对程序做大量测试并记录,在每次实现预期功能基础上新增更多的功能,在实验出错的情况下换一个角度开发出新的可行功能。预测出可以进一步实现的功能,可聚类出口音方言识别,添加GUI图形用户界面,嵌入式程序应用等等。基于DTW算法的语音识别在端点检测上具有很大的优势,可以较快较准的检测到有效语音的端点位置,提高了识别准确性和识别速度。本文在MATLAB环境中仿真了语音的预处理、端点检测、特征参数提取、模型训练、模型匹配和识别语音等过程。并且自建了多套声音模板,通过多次语音识别测试了程序语音识别功能的合理性。最后对语音识别的研究前景做出了展望。
其他文献
2010年上海世博会芬兰展馆定名为Kirnu"冰壶",表达了 "优裕、才智与环境"的主题。微型城市芬兰展馆将向大家呈现一个微型的芬兰,向世界展现芬兰及其整个社会的风貌。展馆雕塑式的
目的从免疫学角度探讨麦门冬汤抗肿瘤作用的机制。方法用小鼠膀胱癌细胞建立小鼠移植瘤模型,给予不同剂量的麦门冬汤灌胃,检测其抑瘤率,以免疫学方法检测小鼠治疗后的细胞免
要做到对热力行业思想政治工作中的人文关怀,那么应加强企业安全知识的教育宣传,强化基层党支部和企业工会的人文关怀作用,并且注重企业人才的培养这三个方面来切入,以期实现
以桂皮、红糖和生姜为原料制备具有抗氧化功能的桂皮姜糖饮,并利用喷雾干燥机制得桂皮姜糖粉,通过测定样品的总还原力、ABTS+·清除能力、DPPH·清除能力和总抗氧化
培材学堂是美国传教士创办的韩国第一个新式西方体系的学校,Kim So-wǒl(1902-1934)、Na To-hyang(1902-1927)、Syngman Rhee(1875-1965)和Chu Si-gyǒng(1876-1914)就是20世纪少数几
以延边朝鲜族自治州为研究对象,基于信息熵权与集对分析相结合的能值分析方法,通过2004—2010年和2011—2017年2个时间段的统计数据平均值,对延边城市生态系统健康进行评估。
数学是学校课程中开设时间最长的一门学科,然而随着学习的深入和课程的加深,其科学性、严密性、抽象性越来越强,许多学生出现了逃学、厌学的情况。所以,在数学教学中,要把情感教育
阳春三月,柳绿花红,春意盎然。全国小麦及制粉行业的代表汇聚在我国小麦生产的第一大省——河南,参加中国粮食行业协会小麦分会的成立大会,研讨小麦及制粉行业的发展大计。《农产
城市生态用地是一个城市生态环境的载体,其在生态环境保护和可持续发展中具有重要意义。该文以可持续发展为目标,借助地理信息系统软件ArcGIS为支持手段,结合生态系统服务价
近日,农业部下发关于认定农产品加工企业技术创新机构的通知。经审核认定,共有北京华都肉鸡公司等297个单位被授予“农产品加工企业技术创新机构”的称号。