语音识别中多时间尺度特征融合方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:jerklie198091
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前的自动语音识别系统都包含一个特征预处理模块,它的目的是通过对语音分帧,提取特征矢量来降低语音信号的冗余度。这些矢量包含了用来区分和识别语音的基本的谱信息。在分析了通常使用的定帧长帧移特征提取方法存在的问题,考察了可能的解决思路之后,本文提出了多时间尺度特征融合的方法,主要的工作和贡献包括: 实现了一种多时间尺度特征融合的方法,使用不同的帧长对每一帧语音提取多种特征,然后将多种特征连接起来。对于连接后的特征,本文使用了两种降维技术--独立成分分析(IndependentComponentAnalysis,ICA)和线性判别分析(LinearDiscriminantAnalysis,LDA)分别对其实施降维,得到和基线系统维数一样的特征; 将基线系统的识别结果和用LDA降维的系统识别结果用ROVER(RecognizerOutputVotingErrorReduction)做融合,选择最优的识别结果。 实验表明,使用LDA降维的系统,词错误率相对基线系统下降了5.12%;使用ROVER做融合,能使词错误率进一步下降。
其他文献
通过超声设备进行产前诊断,及早查出畸形胎儿并采取相应措施,是降低出生缺陷发生率的重要手段。头部由于其重要性且具有明显特征,成为研制胎儿畸形产前超声诊断专家系统第一步工
近年来,传统的客户端/服务器模式由于受到硬件和体系结构的限制,已无法满足Internet快速增长的需要。对等网络(Peer-to-PeerNetwork,简称P2P网络),作为一个新的互联网应用模式,得
学位
近年来,由于互联网的广泛普及和宽带网络的高速发展,对网络带宽要求较高的网络多媒体技术也发展迅猛,其中基于流媒体技术的相关开发与应用成为当前热点之一。传统的流媒体系
摘要:新形势下的课堂模式给我们解决了内容多、时间少的问题。课堂对教师来说,就是教学方式。在课堂改革中,教师应从角色、观念上转变,更要做好课前、课中等方面工作的改变,真正做到高效率、高质量地完成教学任务,促进学生获得高效发展。  关键词:小学数学;高效课堂  一、营造良好的师生关系  师生关系直接影响高效课堂的实现。在以往的教学中,教师一直强调的是以严管教,使得学生害怕老师,师生关系比较僵硬。在课堂
天基空间目标监视系统具有对空间目标监视、跟踪和识别的能力,提供空间目标的类型、状态、轨道位置,对国民经济发展和国家安全有重要战略意义。空间运动小目标检测技术是空间目
数据库技术是信息系统的基础和核心,在企业信息化领域发挥着重要作用。数据库设计在应用系统设计中起着举足轻重的作用,数据库设计的好坏是影响性能及可用性的关键因素,直接决定
本文综合利用自动控制技术、通信技术和计算机技术,实现了一种结合B/S和C/S模式优点的远程监控系统解决方案,对水电站进行实时监控。该系统分为厂站端和远程客户端两部分,厂
光码分多址(OCDMA)由于具有全光信号处理,异步随机接入,灵活的带宽管理和软容量,适合突发业务,能支持多业务和多服务质量等优点,是构建光接入网和骨干网实现光信号复用及标记交换
CCD(Charge Coupled Devices)即电荷耦合器件是一种新型的光电成像器件,具有动态范围大,量子效率高,电荷转移效率高,光谱响应范围宽,几何稳定性好等优点。然而,CCD图像传感器的输出
指纹奇异点在指纹注册以及指纹分类的应用中扮演着关键的角色。本文提出了一种基于指纹方向场与复数滤波的奇异点检测算法,可以分别对指纹中的中心点与三角点进行定位。算法首