随机段模型快速解码算法及其关键词检测研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:ivantesr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学模型,是语音识别领域的核心研究方向之一。随机段模型(StochasticSegment Model,SSM)放宽了隐马尔科夫模型(Hidden Markov Model,HMM)在给定状态时语音观测矢量相互独立的假设,获得了比HMM系统更高的识别性能,然而过高的计算复杂度,成为制约段模型实用的关键问题。本文针对段模型解码算法及其语音识别系统和关键词检测系统,进行的主要工作有:   提出了基于相邻段的并行解码算法(Parallel Decoding of NeighboringSegments,PDNS),该算法改进了分步段计算方法,能够同时对多个语音段进行解码并剪枝。PDNS算法是一种局部解码方法,能为剪枝提供更高更精确的阈值,因而可以剪掉更多的不匹配模型。将该算法应用到LVCSR系统中,在基本不影响识别精度的前提下,节省了50%的计算时间。   由于计算复杂性过高,在LVCSR中,段模型更多的是扮演一种辅助的角色。本文提出了基于HMM预切分的随机段模型重估算法,使用SSM对单音子HMM系统生成的lattice进行二次搜索,利用lattice内的节点信息和弧信息来更新SSM扩展集,以成倍加速段模型解码;对三音子HMM生成的N-Best进行重新验证,分别采用了固定边界得分、局部最大得分和整体最优得分的原则来重估每条路径,重估后的错误率相对HMM基线系统下降了4.81%。段模型重估算法耗时比基础解码大为减少,为段模型的实际应用提供了参考。   在LVCSR系统的基础上,我们搭建了一个基于HMM/SSM的关键词检测系统,该系统以声韵母网络为核心,包含了语音分割、声韵母网络生成、关键词检测等模块。系统提供了基于单音子HMM、三音子HMM和SSM的搜索引擎供选择,在实验中,我们对比分析了三种模型的优劣。  
其他文献
增强现实(AR)是虚拟现实技术的一个重要发展方向,是新一代的人机交互技术,具有广阔的应用前景和重要的研究价值。增强现实技术通过计算机产生虚拟信息与真实世界融合,增强了人们
学位
坦克火控系统在坦克火力打击中起着重要的作用。图像跟踪技术由于其无源、隐蔽性好等特点已逐渐在坦克火控系统中得到广泛应用。在我国现役坦克中,59式坦克占所有主战坦克的70
随着国家对煤矿安全生产要求的提高,国内各煤矿对安全生产配套设备的应用也日益广泛。本论文所研究的控制系统是为国内某重型机械公司生产的矿用液压支架而设计的装置。在根据
车牌图像复原是智能交通系统中的重要研究内容,可辨认的车牌图像能为交通事故的追查提供重要的线索和证据。本文对交通视频中序列图像复原的相关技术进行了研究,包括运动目标检
学位
学位
本课题结合国家863高技术计划“面向流程与混合行业的可配置MES产品及行业解决方案”项目2007AA040702和“吉林省延吉卷烟厂制丝生产线生产管理系统”项目选题进行研究与软件
无线传感器网络作为一种事件监测和数据采集技术,已被广泛应用于环境监测、军事监控和工业自动化等领域。随着无线业务的快速增长,无线传感器网络设备和WiFi,蓝牙,射频识别等技术
本论文从单波束测深原理出发,设计适用于实验室教学的浅水单波束声纳测深系统,用实验室水槽模拟海洋环境,在水槽中埋设各种模型构件,进行测深实验,对测深数据进行分析和校正,并在PC
托辊在国民经济的各行各业扮演着十分重要的角色,尤其在矿业生产的输送过程中,托辊更是发挥着巨大的作用。本项月旨在为托辊的自动化装配线提供整套控制执行系统。小文根据沈阳
自治水下机器人(AUV)作为人类肢体和大脑在水下的延伸,可以在人类无法到达的深度和广度上进行探测、识别和作业,为海洋的开发、水下工程建设和海疆的防卫做出不可替代的贡献。