维吾尔语方言口语语音识别中声学建模及多发音字典自适应研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:cctvnba_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化水平的不断提高和国际交流的日益频繁,世界各国对语音识别的需求急剧增长。方言口语的语音识别是国内外研究的难点问题,少数民族语言的方言语音识别研究甚少,维吾尔语的方言口语语音识别研究尚属起步阶段。本文主要围绕维吾尔语声学特征的提取和模型训练,以及方言口音发音变异与多发音字典自适应的方法展开研究。运用三种策略对声学特征的提取和模型的训练进行优化,针对基于标准语音的识别系统在识别带有发音变异特征的方言口音语料时识别率低这一问题,提出一种在标准维吾尔语发音字典的基础上进行多发音字典自适应的方法。采用基于专家知识(Knowledge-Based)和数据驱动(Data-Driven)相结合的方法,分析维吾尔语方言口音发音变异规则,通过建立发音混淆矩阵(ConfusionMatrix)和挖掘模糊发音映射对(MappingPair),构造发音变异集合,生成初始的多发音字典(Multi-PronunciationDictionary)。然后运用剪枝算法和门限阈值,从方言口语训练语音数据中获得精简的多发音字典,最终提高维吾尔语方言口语语音识别的识别率。   目前,国内很多自动语音识别系统(AutomaticSpeechRecognition,ASR)对发音规范的说话人,能够达到较好的识别性能,而对于带方言口音的自然口语的语音识别性能会急剧下降。维吾尔语方言口语的语音识别更未被深入研究。本文将焦点定位在维吾尔语带方言自然语音的识别问题,在基于维吾尔语方言口语语音识别的声学建模方面进一步探索,尝试从声学建模和多发音字典自适应的角度解决由于方言口音给识别任务带来的严重的识别困难,提出新的思路并通过实验证明其有效性,同时也为后续的深入研究积累了经验。   本文的主要工作和创新点概述如下:   (1)研究建立并完善维吾尔语方言口语带声学特征的语料库,对其特征进行系统地声学分析。为后续进行该语言的标准音的推广使用、语音教学、语音通讯、语音识别等研究提供真实有效的依据。   (2)研究针对新疆地区少数民族语言语音识别相关技术研究尚处于初期阶段,缺乏相关积累的现状,提出基于子带频谱密度的语音端点检测等语音预处理方法,并设计适用于维吾尔语的聚类问题集,进行声学模型的训练和优化策略研究。   (3)研究中对维吾尔语的语音特性研究进行知识融合与技术创新,提出并实现对维吾尔语方言口语语音识别中多发音字典自适应(PronunciationDictionaryAdaptation,PDA)的框架体系研究。使用基于数据驱动和专家知识相结合的方法对方言口音中存在的发音变异现象进行分析研究,提出基于Uni-gram的累计概率剪枝策略对多发音字典进行有效剪枝,并对多发音字典输出概率进行归一化。验证发音字典自适应方法在维吾尔语方言口语语音识别中的有效性,从而有效提高识别率。   本研究将为维吾尔语语音信息处理和深层次的应用提供相应的基础支撑,为国家少数民族语言语音文字信息资源的建设起到填充作用,具有重要的研究价值和现实意义。研究致力于推进少数民族语音识别研究进程,满足当地多语种语音系统应用需求,探求一种适用于少数民族地区推广使用的研究方法,积累所需的经验并完善实施流程,从而满足信息处理技术领域日益增长的需求。
其他文献
心率变异性(Heart rate variability,HRV)是指心率节奏快慢随时间所发生的变化。HRV的研究目的是分析逐个心动周期的细微的时间变化及其规律。这种变化在体表记录的常规心电
社区问答系统已成为互联网上信息获取和知识分享的重要媒介。例如Yahoo!Answers、百度知道等社区问答网站每天发布有数以万计的问题。与此同时,社区问答系统也积累了数以亿计
数据处理是计算机最核心任务之一。随着互联网和计算机技术的发展,电子数据量的急剧增加,普通计算机系统的处理能力已经不能满足大规模数据处理的需求;同时,随着Web2.0和社交网
中小学代数应用题的研究一直是国内外智能教学系统的研究热点,随着语言描述复杂性的提高及方程解题思想的引入,代数应用题智能教学系统面临更大的困难。本研究以我国中小学代
自动语音识别技术经过60多年的研究和开发,取得了很大进展。目前,英语、汉语等大语言的语音识别技术逐步成熟,开始进入商用阶段。维吾尔语语音识别研究在近几年才得到重视,在研究
在信息技术快速发展的今天,网络使得数据传输更加有效。无线传感器网络因为其自身的网络环境复杂恶劣,以及对信息及时性和准确性的高质量要求,已被广泛应用到军事领域、环境
互联网技术的发展一直是以人为本,用户体验是互联网产品的命脉所在,而快速便捷的服务是用户体验中最重要的因素之一。搜索引擎曾经一度让人们从海量网页中获取有效信息的繁琐中
在社会经济高速发展的今天,人类赖以生存的自然环境受到了前所未有的破坏,人们越来越认识到森林对环境保护的重要性。为了对森林生态环境更好的认识和保护,借助于现代无线传
随着计算机科学技术的飞速发展,网络在人们的生活中扮演了越来越重要的作用,各种新兴的互联网应用遍地开花,人们在享受互联网为生活带来的便利的同时,也为互联网创造了一份价值,就
手绘草图是一种自然的符合人类纸笔交互习惯的交互方式,适用于表达思想,特别是进行及时的思想捕捉。草图动画具有直观性、动态性的特点,适合于在讨论中支持用户进行想法交流,特别