鲁棒性语种识别关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：yp0202

【摘要】

：

给定一段语音，自动给出语音语种信息的语种识别技术，在多语种语音服务，信息安全等许多领域都有着非常广泛的应用。语音环境的复杂多变是语种识别技术从实验环境应用到实际环境中

【作者】

：

杨金超

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2013年期

【关键词】

：

语种识别总变化量因子分析局部保留映射概率线性鉴别性分析多重总变化量因子分析鲁棒性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

给定一段语音，自动给出语音语种信息的语种识别技术，在多语种语音服务，信息安全等许多领域都有着非常广泛的应用。语音环境的复杂多变是语种识别技术从实验环境应用到实际环境中的重要挑战。不同的环境背景噪声，不同的传输信道等因素都将造成测试语音与训练语音不匹配，从而使语种识别的性能大幅下降。提高语种识别系统的鲁棒性成为语种识别技术更好地在实际中应用的必然要求。本文基于当前鲁棒性语种识别技术的发展，从语种声学特征的鉴别性建模，表征语音语种信息特征的鲁棒性学习以及更精细的语音语种信息的表征等方面展开探索和研究，主要的研究工作和创新点包括:　　1.研究并实现了语种识别声学特征建模关键技术-PushingModel技术。通过对基于最大似然估计的生成性GMM建模方法和基于最大互信息估计的鉴别性GMM建模方法的分析，推导了统一的语种识别GMM模型鉴别性训练框架，并将最新的PushingModel技术归纳到这一统一的训练框架。进一步引入largemargin思想，基于语种GMM模型鉴别性训练的统一框架，提出了基于最大混淆度的语种GMM模型鉴别性训练方法-LMPushing技术。基于LMPushing的语种识别系统的性能远好于基本的GMM语种识别系统的性能，表明归纳的统一框架的正确性和推广性。与不同的GMM模型鉴别性训练方法MMI和PushingModel比较，LMPushing鉴别性训练方法对测试语音时长变化更加稳健。　　2.近年来，总变化量因子分析技术迅速成为语种识别及说话人识别的主流技术，本文独立地将总变化量因子分析技术和支持向量机结合引入语种识别。总变化量因子分析就是将语音数据用低维向量来表示，在低维空间进行鲁棒性学习，从而消除有害的信道信息，提高语种鉴别性。在传统的对于总变化量因子向量空间线性鉴别性分析的基础上，本文引入局部保留映射，利用局部保留映射对总变化量因子向量空间几何分布的学习，通过保留局部信息，使相同语种的向量更聚集，从而减小或消除有害的信道信息的影响，提高语种识别性能。进一步引入概率线性鉴别性分析，利用概率线性鉴别性分析较强的低维学习能力，减小或消除有害的信道信息，保留语种鉴别性信息，进一步提高语种识别的性能。　　3.提出多重总变化因子分析的思想，充分利用语种训练数据的语种先验信息，估计更准确的表征语音数据语种信息的高斯超向量，结合总变化量因子分析对语音高斯超向量低维表征的优势，以多重总变化量因子向量更精细的表征语音数据的语种信息。多重总变化量因子分析进一步提高了声学建模语种识别系统的性能，成为我们所有语种识别系统性能表现最优的单系统。

其他文献

谈谈如何实施高中体育新课标教学

摘要：课程标准立足于学生的学习，对学生的学习结果提出了要求，教学中如何展示、过度衔接等要讲究科学性，重视理解、分析等基本技能训练。　　关键词：高中体育；体育教学；新课标教学；探讨研究　　中图分类号：G633.96 文献标识码：A 文章编号：1992-7711（2017）11-0011　　新课标实施以来，新的教学理念融入课堂，学生在新的教学沃土中成长；随着2008年高考新方案的公布，教師掂量着体

期刊

高中体育体育教学新课标教学探讨研究

基于分层PCE的光网络跨域并行建路方法研究

由于网络业务需求量的快速增长以及网络技术的多样化发展，目前光网络的规模日益增大，为了便于维护和管理，光网络整体上呈现出多域化的趋势。鉴于保密性和安全性的考虑，各个域之间

学位

路径计算单元资源预留多域波长连续性约束路径建立

明胶酶介导的肿瘤靶向性rhTNF-α原核表达质粒的构建及表达产物分离纯化的实验研究

肿瘤坏死因子-α(tumor necrosis factor-α，TNF-α)是一种多功能细胞因子，具有在体内外直接杀伤肿瘤细胞的特性，是迄今为止发现的抗肿瘤细胞活性最强的细胞因子。但由于大量全

学位

肿瘤坏死因子融合蛋白基因表达蛋白质纯化DNA序列分析明胶酶

超声探测人脸识别中特征提取和优化方法研究

超声探测人脸识别与传统基于图像的人脸识别方法相比，具有不受光线变化等环境因素影响的优点，其核心是解决如何利用空气中超声波探测方式实现多类别、具有复杂几何外形目标识别

学位

人脸识别超声探测特征提取特征优化数据库

干扰避免技术在LTE-A中的应用

干扰避免技术是LTE-A的主要研究内容，旨在通过无线通信系统中传输信号的处理、用户调度等算法的研究，提出一种革新的干扰避免方法，从而提高系统性能并增强用户体验，但是到目前为

学位

干扰避免动态波束控制协作多点协作调度

基于SAR图像的土壤水分反演技术研究

在水文、气象和农业环境研究中，土壤水分是非常重要的参数。合成孔径雷达(Synthetic Aperture Radar，SAR)系统可以全天时、全天候获取观测区域高分辨率二维图像。利用雷达遥感

学位

合成孔径雷达图像信息土壤水分地表参数工作原理

干细胞治疗缺血性心肌病及血液肿瘤的循证转化初探

目的：（1）聚类分析干细胞临床应用高质量证据的结构特征，为评价干细胞治疗的方法特征、疗效及安全性，为高质量证据临床转化提供直接依据；（2）系统分析干细胞治疗心肌缺血性疾病及血液肿

学位

干细胞缺血性心肌病血液肿瘤循证转化临床疗效治疗策略

MCP-1诱导血管平滑肌细胞增殖的机制

目的：研究单核细胞趋化蛋白1（Monocyte chemoattractant protein-1，MCP-1）诱导血管平滑肌细胞增殖的机制；　　方法：1.MCP-1作用VSMCs24 h后，用NADPH氧化酶活性测定试剂盒检测细胞内

学位

单核细胞趋化蛋白1血管平滑肌细胞诱导增殖机制信号通路

中红外双通道地表温度反演方法研究

地表温度(Land Surface Temperature，LST)是地表能量平衡中的一个重要参数，在地-气相互作用过程中扮演着十分重要的作用，在气象、地质、水文、生态等众多领域有着广泛的应用。高

学位

中红外地表温度劈窗算法敏感性分析AHS数据通道组合模式

miR-205-5p基因甲基化对乳腺癌发生、发展的作用初探

miRNA是一类由19~26个核苷酸组成的内源性非编码小RNA，通过其“种子序列”识别并结合靶mRNA的3’端非翻译区（Untranslated region，UTR）从而调控基因的表达。研究发现，miR-205-5p与

学位

miR-205-5p基因甲基化乳腺癌发病机制

鲁棒性语种识别关键技术研究

其他学术论文