基于电话语音的少数民族语种识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:qianchen912009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID),是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。它已经广泛的应用于信息检索和军事安全等领域。当前语种识别系统主要有三个方面:音位结构模型系统、声学模型系统以及联合系统。其中声学模型系统由于不需要人工标注语料,而且系统扩展性好,所以得到了广泛的应用。本文研究与文本无关的少数民族语种识别方法,采用高斯混合模型—通用背景模型(Gaussian Mixture Model-Universal Background Mode, GMM-UBM)建立语种识别系统,探索提高识别率的途径。论文的主要工作有:(1)少数民族电话语音数据库的录制,该数据库包含了9个少数民族语和汉语普通话共10个语种,每个语种有50个发音人,男女比例约为1:1,并进行语音数据的整理。(2)构建一个基于GMM-UBM的少数民族语种识别系统,设计并实现语种识别实验:用双门限的方法进行语音检测;提取MFCC和SDC特征参数;训练UBM模型和GMM模型。(3)用6个民族的不同时长的测试语音和汉语借词进行测试。按四种测试语料分别给出各个语种的识别率,对比两种特征的识别率,从语音学的角度分析各语种之间误识别的原因,还分析了汉语借词对少数民族语种识别率的影响。实验结果表明,论文设计的基于GMM-UBM的语种识别系统具有较好的扩展性;双门限的方法进行语音检测,能有效地去除噪音,提取到有用的语音帧;基于SDC特征参数的少数民族语种识别率明显高于基于MFCC特征参数的识别率;6个语种之间存在有规律的误识别;对汉语借词的识别,实验结果表明汉语借词会使少数民族语种识别率明显下降。
其他文献
无线传感器网络的研究涉及无线通讯技术、嵌入式计算机技术、微电子技术、智能控制技术、现代传感器技术等多个学科,在环境监测、智能家居、现代农业等许多领域都有广泛的虑
当今汽车安全和辅助驾驶系统越来越引起人们的重视。其中自适应巡航控制(ACC:Adaptive Cruise Control)作为一种辅助驾驶系统,得到了广泛研究。ACC能根据传感器检测到的驾驶
移动机器人同时定位和地图构建(Simultaneous Localization and Map-Building,SLAM)问题是移动机器人研究领域的基本问题与研究热点。SLAM问题中,地图如何表示是一个重要问题。
自1999年5月Napster的引入开始,P2P联网的新技术大量增长,今天,P2P流量已成为Internet流量的主流。有数据显示,仅在2002年年初由P2P应用所引发的信令流量就达到了总流量规模
“从定性到定量的综合集成法”是我国科学家提出的用于解决开放的复杂巨系统及其相关问题的方法论。综合集成研讨厅作为这一方法论的发展,将专家的智慧、计算机的高性能及已
绳索牵引自动水平调节机器人,能解决长期困扰载荷装卸领域的姿态调节和受力控制难题,有效保障昂贵及高精密性的载荷在吊运和装卸过程中的安全。因此相关研究具有重要的理论意
核磁共振(NMR-Nuclear Magnetic Resonance)技术的无损检测特点使其具有明显的优势,特别是当前食品安全和工业生产造成的环境污染成为国内关注的焦点,快速、实时、无损的现场检
随着互联网的蓬勃发展,网络媒体已逐渐成为人们获取信息的重要来源。网络媒体包括了大量的图片、Flash网络动画等多种媒体资源,如何对这些资源进行有效地管理,如何对这些资源进
本文主要针对排序学习的一些相关问题进行研究。由于排序学习重要的实际意义,因此已经得到了机器学习以及信息检索领域研究学者的广泛关注。排序学习是一个典型的非光滑优化问
在人的视觉感知、识别和理解中,形状是图像中目标的基本内在特性,是用于目标识别的重要特征,因此基于形状的图像匹配、目标识别方法研究具有重要意义。针对不同的研究目的,人