【摘 要】
:
语音识别的目的是让机器理解人的语言,实现更方便直接的人机交互。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用。越来越多具有语音识别功能的产品进入人类
论文部分内容阅读
语音识别的目的是让机器理解人的语言,实现更方便直接的人机交互。经过几十年的研究和发展,语音识别技术已日渐成熟并逐渐走向实用。越来越多具有语音识别功能的产品进入人类的日常生活。然而语音识别技术对环境的依赖性很强,语音识别系统通常是将在安静环境下训练得到的模板应用于实际环境中。而实际环境中一般都存在噪声,随着环境噪声的加大,识别性能将会急剧下降,这是因为噪声对语音识别的影响很大,而对噪声的处理比较困难,如何建立鲁棒性识别系统成为语音识别领域的重要研究课题。本文介绍了语音识别的主要应用领域,国内外发展历史与研究现状,简要介绍了语音识别的基本方法及涉及到的关键技术,包括语音识别系统的分类、识别基元的选取以及模板训练与模式匹配的主要方法等。分析语音识别系统的基本结构及涉及到的各种主要技术,讨论了语音信号的预处理及语音信号各种主要时、频域特征参数的提取,重点分析研究常用且效果良好的、反映语音倒谱特征的线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)的提取方法。隐马尔科夫模型用统计原理建立语音识别的声学模型,是目前语音识别的主流声学建模技术,本文重点介绍了隐马尔科夫模型的原理及其在语音识别中的应用,并探讨了其局限性。最后在HTK平台上实现了中等词汇量特定人汉语连续语音识别的实验,验证了语音识别各个步骤的工作,提取出多种语音特征参数并对其进行对比实验以比较不同特征参数的识别效果;通过实验讨论HMM状态数的不同对识别率的影响;讨论基于最小统计谱减法的语音增强技术对加性噪声的抑制效果。
其他文献
双目视觉三维重建是计算机视觉领域重要的研究内容之一,在精密测量、机器人导航、虚拟现实等方面均得到了广泛的应用,对三维真实感建模具有非常重要的现实意义与理论研究价值
随着我国高速铁路和客运专线的建设,GSM-R(Global System for Mobile communication-for Railway)数字移动通信系统在我国迅速发展,并且针对不同的应用开展了相应的试验。如何
FCoE(Fibre Channel over Ethernet)通过将光纤通道协议架构承载在增强型以太网上,实现S AN(Storage Area Network)与LAN(Local Area Network)的融合,降低了存储网络在构建与
被动毫米波成像已经越来越成为毫米波领域的一个研究的热点。被动毫米波成像在雾、云、烟尘等恶劣气候条件下具有潜在的优势。但是也存在着空间分辨率不高和灵敏度较低的不足
随着网络技术的飞速发展,网络安全问题也越来越突出。于是,人们提出了主动的网络安全防御体系——网络监听与入侵检测系统。入侵是任何企图破坏资源的完整性、保密性和可用性的
近年来,随着CAESAR竞赛的举行,使得对认证加密方案的研究达到了一个新的高潮。由于认证加密方案集保密和认证功能于一身的技术优点,其可被广泛应用于既需要加密又需要进行数
在过去的几年,随着无线宽带接入技术飞速发展和无线终端设备迅速普及,无线局域网逐渐成为生活的必需品。人们已不再满足于传统的低速率业务,转而希望得到高吞吐率,高带宽的多
电压是电能质量的重要指标之一,线损是电力企业的一项重要综合性技术经济指标。长期以来电力系统线路损耗问题比较突出,而无功补偿是降低线损的有效手段。随着电力系统负荷的增
多天线技术能够在不增加天线发送功率及频谱资源的情况下成倍的提高系统容量,是下一代无线通信系统的关键技术之一。通过进一步增加天线阵元的规模,Massive MMO系统又进一步