大词表连续语音识别系统的研究与实现

被引量 : 0次 | 上传用户:t573249005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大词表连续语音识别是语音识别研究的重点与难点之一,它涉及了声学模型、语言模型、搜索算法等多方面的知识与技术,是语音识别研究中的集大成者,大词表连续语音识别中使用的算法和技术对其他语音识别应用也有着主要的启发和借鉴作用。本文将讨论我们在大词表连续语音识别研究方面遇到的问题和取得的成果,并给出汉语大词表连续语音识别的搜索策略。论文深入分析了N-gram、潜在语义分析等常见语言模型的构建方法,实现了多种适用于语音识别领域的模型平滑算法。论文深入研究了连续语音识别的各种搜索策略和核心算法,设计了树状令牌搜索算法,并针对一遍语音识别搜索和多遍搜索两种不同应用场景,分别实现了两种不同的令牌搜索形式:通过不同的树结构组织搜索路径,通过树状、网状两种不同的共享结构来组织解码历史记录,有效地组织了搜索和剪枝过程,避免了令牌历史记录对存储空间的浪费。论文深入研究了大词表连续语音识别中搜索空间的控制策略,综合应用多种剪枝方法、前向预测技术控制搜索空间规模,并针对树状令牌算法的特殊需要,对这些剪枝算法进行了一定的改进,提高了语音识别系统的实用性。论文深入研究了大词表连续语音识别中语言模型的组织与利用方式,采用词典树、集成语言模型等方式合理的将语言模型信息引入到语音识别过程中,充分发挥了语言模型对识别的指导作用。为了高效地将Trigram、潜在语义模型等相对比较复杂的语言模型引入到语音识别过程中,论文汲取多遍搜索的一些思想,对一遍搜索策略进行一定改进,提出了部分路径调整算法,合理的将上述模型结合到一遍搜索的过程中,解决了识别精度与搜索效率的矛盾。在以上研究的基础上,我们构建了全新的Gallina实验平台的语音识别模块,综合利用声学模型、语言模型知识,高效的实现了树状令牌搜索,使Gallina具有了完善的语言层的解码能力,成为了一个结构相对比较完整的语音识别系统。Gallina在大词表连续语音识别实验中取得了令人满意的识别结果。
其他文献
针对当前多数C类航空座椅主结构吸能能力有限、无专有吸能部件,为满足动态性能指标,需要通过反复试验改进座椅设计的现状,在某型C内航空座椅的X型升降底座上安装专用吸能部件
钢吊箱作为大型桥梁深水区主塔承台施工的防撞装置兼顾混凝土浇筑模板,是形成承台施工作业面、保障工期的重要施工步骤。而钢吊箱水下封底混凝土施工的好坏,是决定承台施工的
翻译的标准一直都是译者追求的完美标准,而大家往往认为翻译的标准就是通顺即可,这对我们熟悉的全译是没有问题的,可是在其他的翻译形式下,就不一定说得通了。尤其是现在中国
小学《道德与法治》部编版新教材融入了许多法治教育的内容,课堂中的法治教育不是对法律法规条文教学与记忆,而是把国家意识、公民意识、规则意识和自我保护意识等融于教育细
会计人生要有定位,定位起航才有目标。人生定位干一行、爱一行,干一行、干好一行,行行出状元。人生要夯实基础:实践基础、理论基础和方法基础。人生有所发展:探索改革与创新
在"十三五"规划期间,会计要适应国民经济和社会的发展,必须牢固树立创新、协调、绿色、开放、共享的发展理念。树立创新理念,提高创新水平,促进会计全面发展;树立协调理念,正
随着电网购行业的发展,网络评论成为消费者决策的重要依据。网络购物评论类型主要可分为好评、差评、追评以及带图评论,不同类型的评论有用性感知程度不同。根据问卷调查结果
熵是对系统状态的描述,而现今存在的地表形态,正是内外营力对抗作用下的一种状态,因而可以用熵来描述。本文提出了一种熵值的计算方法,利用侵蚀流域等高线所提供的状态信息,
随着“互联网+”时代衍生的共享经济的到来,共享汽车逐渐进入到各大城市,深入到人民的出行生活。共享汽车具有很大的发展潜力,兼备环保、便捷、经济等优点,不仅顺应了时代的发展潮流,长期来看,更能缓解道路交通的压力,是未来市民出行的一大主流。作为分时租赁的一种新形式,共享汽车给用户带来了两极分化的体验,让用户有时既觉得方便划算,又觉得体验不够好。而这些不好的体验可总结为以下四个问题:基础配套设施不完善;使
碱法生产氧化铝的关键在于铝硅分离,而水合硅酸钙在碱法生产氧化铝工艺中是一种重要的含硅化合物。由于其中的硅不结合铝和碱,随着铝土矿资源的日益贫化,该种物质越来越受到