针对维吾尔语电话交谈式语音的关键词检测技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ellenaic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文要建立能够帮助用户从电话交谈式话音中获取信息的维吾尔语关键词检测系统。为实现该系统,我们要解决维吾尔语的黏着性以及训练数据不足给语音识别带来的困难。为了缓解黏着性带来的维吾尔语词语意义尺度过大的问题,我们使用子词代替词语作为解码单元。训练数据不足容易导致关键词的语言模型概率偏离真实值。通过合理的抬高关键词的语言模型概率,我们可以提高关键词检测系统对识别错误的容忍能力。我们还实现了利用用户反馈调整关键词声学模型参数的技术,使得关键词系统的性能随着使用不断提高。  本文的主要贡献和创新点包括:  开发了比较完整的维吾尔语形态分析器,可以将词语分解为词干和附加成分。  提出了一种鉴别性的方法来实现形态分析和无监督词语分解的联合。  比较不同识别单元和索引单元的关键词检测系统性能,确立维吾尔语关键词检测系统的框架。  提出了语言模型得分补偿技术来增强关键词检测系统对识别错误的容忍能力。  实现了利用已有命中和虚警调整关键词声学模型参数的方法,可以使系统的性能在使用过程中不断得到改善。
其他文献
本文对水稻、黄瓜、大刍草细菌人工染色体文库进行了分析。本研究以濒临绝种的多年生大刍草为材料,以plndigoBAC5为载体,构建了细菌人工染色体文库(BAC)该文库是目前首个大刍草
近日,为清理整顿人力资源市场秩序,规范劳务派遣企业发展,辽宁省沈阳市人社局依据相关法律法规和政策意见,联合沈阳市市场监督管理局,对全是700余家劳务派遣企业开展跨部门联
期刊
随着“三网融合”项目的不断推进,以电信宽带专网或有线电视运营商为传输网络,以电视机加机顶盒为终端设备,为用户提供互动多媒体服务的IPTV(InternetProtocolTelevision)得到了
波达方向(DOA: Direction of Arrival)估计在移动和卫星通信系统、信息战、雷达、被动声纳、地震学、射电天文学、导航、视频会议、时间序列分析、谱估计等方面有着广泛的应
极化合成孔径雷达是一种先进的微波遥感工具,能够提供比单极化合成孔径雷达更多的信息量,已经成为国内外微波成像发展的热门方向之一。极化合成孔径雷达图像分类与极化目标分解
目的:研究革兰阴性非致病菌成团泛菌脂多糖(Pantoea agglomeranslipopolysaccharide,LPSp)作为佐剂对狂犬病毒抗原免疫效果的影响。方法:1、分组:将纯系(Balb/c)小鼠随机分为
学位
研究背景:心肌肥大是以心肌纤维变粗为特征,继而导致心室壁增厚,心脏体积增大的心脏病症。它是高血压、心瓣膜病、先天性心脏病及动脉粥样硬化等心血管疾病的常见并发症。心
合成孔径声纳(Synthetic Aperture Sonar)是现代一种常用的水下探测声纳,它的基本原理是小尺寸的基阵通过匀速直线运动来模拟大孔径基阵,从而获得距离向和方位向的高分辨率。该
连续波雷达采用收发分置的工作方式,发射通道一直在发射电磁波,因此,接收通道接收到的信号不仅包括运动目标的回波信号和背景杂波信号,还包括发射通道耦合过来的直达波信号,通常直