语音识别中多时间尺度特征融合方法研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：jerklie198091

【摘要】

：

当前的自动语音识别系统都包含一个特征预处理模块，它的目的是通过对语音分帧，提取特征矢量来降低语音信号的冗余度。这些矢量包含了用来区分和识别语音的基本的谱信息。在分析

【作者】

：

王涛

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2008年期

【关键词】

：

语音识别多时间尺度特征预处理语音分帧独立成分分析 LDA降维

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前的自动语音识别系统都包含一个特征预处理模块，它的目的是通过对语音分帧，提取特征矢量来降低语音信号的冗余度。这些矢量包含了用来区分和识别语音的基本的谱信息。在分析了通常使用的定帧长帧移特征提取方法存在的问题，考察了可能的解决思路之后，本文提出了多时间尺度特征融合的方法，主要的工作和贡献包括：实现了一种多时间尺度特征融合的方法，使用不同的帧长对每一帧语音提取多种特征，然后将多种特征连接起来。对于连接后的特征，本文使用了两种降维技术--独立成分分析(IndependentComponentAnalysis，ICA)和线性判别分析(LinearDiscriminantAnalysis，LDA)分别对其实施降维，得到和基线系统维数一样的特征；将基线系统的识别结果和用LDA降维的系统识别结果用ROVER(RecognizerOutputVotingErrorReduction)做融合，选择最优的识别结果。实验表明，使用LDA降维的系统，词错误率相对基线系统下降了5.12％；使用ROVER做融合，能使词错误率进一步下降。

其他文献

超声图像胎儿颅骨检测

通过超声设备进行产前诊断，及早查出畸形胎儿并采取相应措施，是降低出生缺陷发生率的重要手段。头部由于其重要性且具有明显特征，成为研制胎儿畸形产前超声诊断专家系统第一步工

学位

超声图像胎儿头部椭圆检测曲线拟合活动轮廓模型颅骨检测产前超声诊断

对等网络检索系统中关键技术的研究

近年来，传统的客户端/服务器模式由于受到硬件和体系结构的限制，已无法满足Internet快速增长的需要。对等网络(Peer-to-PeerNetwork，简称P2P网络)，作为一个新的互联网应用模式，得

学位

对等网络

P2P实时流媒体直播技术的研究与实现

近年来,由于互联网的广泛普及和宽带网络的高速发展,对网络带宽要求较高的网络多媒体技术也发展迅猛,其中基于流媒体技术的相关开发与应用成为当前热点之一。传统的流媒体系

学位

多媒体技术多媒体技术流媒体直播技术流媒体直播技术身份认证身份认证频采集设备频采集设备

浅谈如何创设高效小学数学课堂

摘要：新形势下的课堂模式给我们解决了内容多、时间少的问题。课堂对教师来说，就是教学方式。在课堂改革中，教师应从角色、观念上转变，更要做好课前、课中等方面工作的改变，真正做到高效率、高质量地完成教学任务，促进学生获得高效发展。　　关键词：小学数学；高效课堂　　一、营造良好的师生关系　　师生关系直接影响高效课堂的实现。在以往的教学中，教师一直强调的是以严管教，使得学生害怕老师，师生关系比较僵硬。在课堂

期刊

小学数学高效课堂

天基深空运动小目标检测方法探讨

天基空间目标监视系统具有对空间目标监视、跟踪和识别的能力，提供空间目标的类型、状态、轨道位置，对国民经济发展和国家安全有重要战略意义。空间运动小目标检测技术是空间目

学位

空间运动小目标检测投影检测直线检测运动估计星图特征

站网运管系统数据库和邮件服务子系统设计

数据库技术是信息系统的基础和核心，在企业信息化领域发挥着重要作用。数据库设计在应用系统设计中起着举足轻重的作用，数据库设计的好坏是影响性能及可用性的关键因素，直接决定

学位

数据库设计邮件管理接口设计网站运管系统

水电站远程监控系统的研究

本文综合利用自动控制技术、通信技术和计算机技术,实现了一种结合B/S和C/S模式优点的远程监控系统解决方案,对水电站进行实时监控。该系统分为厂站端和远程客户端两部分,厂

学位

水电站水电站远程监控系统远程监控系统WEB数据库WEB数据库网络安全网络安全

二维光码分多址编码理论研究及试验系统实现

光码分多址(OCDMA)由于具有全光信号处理，异步随机接入，灵活的带宽管理和软容量，适合突发业务，能支持多业务和多服务质量等优点，是构建光接入网和骨干网实现光信号复用及标记交换

学位

光网络通信码分多址信道编码码集构造

基于FPGA的数字相关双采样技术的研究

CCD(Charge Coupled Devices)即电荷耦合器件是一种新型的光电成像器件，具有动态范围大，量子效率高，电荷转移效率高，光谱响应范围宽，几何稳定性好等优点。然而，CCD图像传感器的输出

学位

电荷藕和器件相关双采样数字相关双采样现场可编程逻辑门阵列FPGA图像传感器滤波器系数

基于方向场与复数滤波的指纹奇异点检测

指纹奇异点在指纹注册以及指纹分类的应用中扮演着关键的角色。本文提出了一种基于指纹方向场与复数滤波的奇异点检测算法，可以分别对指纹中的中心点与三角点进行定位。算法首

学位

方向场复数滤波指纹奇异点检测指纹分类指纹数据库置信度图像

语音识别中多时间尺度特征融合方法研究

其他学术论文