【摘 要】
:
当今语音识别技术迅速发展,在很多领域得到应用,语音检索技术也应运而生。但由于噪声、口音、语速以及集外词等原因,语音识别的结果中难免会包含许多的错误信息,这将严重影响
论文部分内容阅读
当今语音识别技术迅速发展,在很多领域得到应用,语音检索技术也应运而生。但由于噪声、口音、语速以及集外词等原因,语音识别的结果中难免会包含许多的错误信息,这将严重影响语音检索的召回率和准确率。本文针对语音检索中语音识别出现的错误,利用混淆矩阵,从错误校正、模糊检索等方面进行容错处理,来提高语音检索的性能。主要工作与创新包括以下几个方面:1.研究了传统的混淆矩阵生成算法及应用。主要研究了从1-best和混淆网络中统计混淆概率的混淆矩阵生成算法。并将混淆矩阵用于错误校正中,实验表明,使用混淆矩阵进行候选扩展,能有效的提高正确结果的召回率。针对语音识别中出现的错误,检索时采用基于混淆矩阵的模糊匹配策略,实验表明,混淆矩阵能有效的召回识别错误的待查询词,提高召回率的同时保证了识别精度。2.提出了一种基于相邻词权重的混淆矩阵生成算法。传统的混淆矩阵生成算法,容易受到对齐错误和识别结果中错误传导的影响,导致统计出的混淆概率不精确。本文利用编辑距离和从已有混淆矩阵中获取混淆概率的方法来判定相邻词的识别情况,并据此为待统计词设定相应权重,保证统计混淆概率的精确度。实验表明,这种方法有效的提高了混淆矩阵的精确度。3.研究了基于混淆网络的混淆矩阵改进算法。针对混淆网络中包含的多候选,本文通过按照识别结果对错区分选择候选项、设定后验概率的阈值、以及加入时间重叠度和声学得分作为权重等多种方法,分别进行对比实验,找到了相对准确的混淆项选取策略。
其他文献
该文在原有的数据广播播出系统基础上,引入标准的TCP/IP协议和成熟的计算机网络技术,进行相应改进和完善后,提出了具有“多协议封装”特色的数据广播播出平怡的设计思路和实
由于企业管理对于会计的要求在不断地提升,管理会计和财务会计因此而逐渐地融合在一起,二者之间相互融合、互相补充,进而能够得到更多的管理信息并且可以让信息变得更加明确
数字图象压缩技术被应用到多媒体、通讯、医学等等各个领域,在未来的科技领域,它仍然显示出其强大的生命力和发展潜力。静止图象压缩不但是各种动态图象压缩、传输的基础,而且,还
该论文对图象处理中的几个问题进行了研究,主要内容如下:1.分析了小波分析的基本原理和多分辨率分解理论,及线性金字塔分解方法,它们是图象恢复和图象增强,去噪的基础.2.提出
该文主要是利用子波变换所具有的优良特性,设计了的种基于子波变换的图像数字水印算法,通过自适应门限的设计,选择不同层次和方向上的水印嵌入子带和尺度系数,从而在保证水印
MANET(MobileAdbocNetworks)网络俗称无线多跳网,它和单跳网(即cellularnetworks)的主要区别是它不需要和有线骨干网相连的基站,因此可以广泛用于有线网络无法获得或难以得到
王安石(公元1021-1086年),字介甫,号半山,北宋时期杰出的政治家、思想家、文学家;抚州临川人(今江西抚州).进士出身,曾任地方官多年.公元1068年,召为翰林学士侍讲.次年任参知
以西兰花“玉冠”品种种子为试材,比较了漂浮法与湿润法育苗对西兰花的出苗率、子叶展平时高度及成苗期种苗素质的影响。结果表明:湿润法的出苗率显著低于漂浮法,子叶展平时
随着社会经济市场结构的不断调整,我国各个企业面临的市场竞争力日渐激烈.房地产企业属于资金高度密集的企业,其具有投入成本高、经营风险大以及经济收益高的特点,现已成为推
MPEG-2由ISO/IEC/JTC/SC29/WG11发展而来,也称为ISO/IEC 13818.MPEG-2图像压缩编码标准主要用于CCIR-601或者更高像素图像的编码,以很有挑战性的4到9Mbps的码率实现很高的图像质量