论文部分内容阅读
对不同语种的语音进行对比分析是语音信息处理的一个重要研究方向,目前我国少数民族语音信息处理和不同语种之间的语音对比研究水平亟待提高,因此使用计算机技术自动处理少数民族语音信息,对推进少数民族语音信息研究水平的提升具有重要的学术和应用意义。本文提出的朝鲜语和蒙古语语音对比分析方法不仅对不同语种的语音对比研究提供了一种新的思路,而且对当前存在争议的朝鲜语是否归属阿尔泰语系问题的研究具有一定的借鉴价值。本文从声学语音学角度比较了两种语音中单元音的相似性,进一步采用模式识别的方法统计并分析了两种语音中相似单元音的分布概率,进而对两种语音的相似性进行了对比研究。 首先,本文提出了通过t-检验的方法确定相似元音对的方法。该方法的实现过程中将单元音作为研究对象,通过线性预测编码(Linear PredictiveCoding,LPC)方法提取单元音的共振峰F1值和F2值,然后通过共振峰参数的t-检验结果确定朝鲜语和蒙古语声学特征相似的5对单元音。 其次,提出了基于静音检测的连续语音段分割方法。该方法通过双门限的有声段检测手段,统计朝鲜语和蒙古语语料中不同类别静音段时长规律,确定最佳的分割阈值,得到了一系列相对独立的连续语音段。 最后,本文提出了连续语音段中基于相似单元音概率统计分布的语音对比分析方法。该方法通过训练相似元音的隐马尔可夫模型(Hidden MarkovModel,HMM)检测并统计相似单元音在连续语音段的段首、段中和段尾等位置出现的概率以及在整个语音中出现的概率结果作为依据进行对比分析两种语言的相似性。 实验结果表明,本文提出的共振峰参数t-检验方法能够证实朝鲜语和蒙古语的5对单元音具有声学特征相似性。另外本文提出的连续语音段中5对相似单元音的概率分布对比结果表明,仅仅从朝鲜语和蒙古语的5对相似单元音的对比结果无法得出朝鲜语和蒙古语语音具有相似性的结论,只能说明朝鲜语和蒙古语语音差异比较明显。