贝叶斯风险解码及多系统联合语音识别应用技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：Spring_880916

【摘要】

：

提高语音识别精度一直是自动语音识别研究领域所关注的核心问题之一。本文分别从单系统以及多系统联合解码方面展开研究，以提高大词汇量连续语音识别的系统识别精度。首先基于

【作者】

：

徐海华

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2010年期

【关键词】

：

自动语音识别贝叶斯风险字图重解码最小音子误差解码无监督模型自适应全局优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提高语音识别精度一直是自动语音识别研究领域所关注的核心问题之一。本文分别从单系统以及多系统联合解码方面展开研究，以提高大词汇量连续语音识别的系统识别精度。首先基于单词识别精度评价准则考虐，本文对贝叶斯风险准则的解码方法提出多种创新实现，这不但为解码方法提供更多有价值的参考，而且能更好地改善系统的识别性能。基于各种单系统解码方法，本文还对多系统联合解码进行了大量地研究，为全面改善语音系统的识别性能提供更多的途径。最小音子误差区分性训练方法在大词汇量连续语音识别中对改善系统性能方面取得了显著效果，究其本质，它是一广义的贝叶斯风险准则。其基本思想是通过更新模型参数优化目标函数，使得模型的区分性性能得到提高。受其启发，本文提出一种最小音子误差准则的解码方法。该方法在实现中以字图为假设空间，以N．最佳句子列表为假设参考空间，利用前后向算法估计假设参考相对字图的平均正确度，而目标是从N．最佳句子列表中选取使目标字图平均正确度最大的假设参考作为解码结果。该解码方法的显著优点是实现简单、效果明显。为进一步研究该解码方法的性能，文中对其解码结果与N-最佳句子列表容量关系进行了研究，发现较小的N．最佳句子列表即能使其解码性能达到饱和。另外，本文还研究了改进的正确度计算方法，将一个局部优化问题转化为全局优化问题求解，从理论上减小局部优化方法所造成的近似。　　基于最小音子误差解码方法对单系统解码的成功应用，本文另一研究重点是利用该方法实现多系统联合解码。为此，本文提出两种系统联合解码方法。一种是改进的N．最佳投票方法，该方法通过优化联合目标函数从合并的N．最佳句子列表中选择若干个最优的解码结果。第二种多系统联合解码方法为改进的N．最佳句子列表解码方法，该方法以混清网络为假设参考空间，通过遍历混淆网络搜索基于联合目标函数最优的解码结果。以上两种系统联合解码方法都取得改进的识别结果。　　最小音子误差解码方法虽然在单系统和多系统联合解码任务中对系统识别性能有显著的改善，但它的不足之处是在多系统联合解码实现方面不直接，计算量偏大。为此文中提出一种迭代实现的贝叶斯风险解码方法。该解码方法通过三个子算法完成：首先通过二维前向算法估计假设参考相对目标字图的期望误差（风险值）：其次，依据前向算法中获取的对齐信息，利用改进的后向算法累积字图中单词标注与假设参考每一位置对齐的似然度；最后利用累积的似然度更新假设参考，重复迭代直至估计风险不再降低为止。该优化方法与离散的期望最大化优化方法类似，通过迭代更新假设参考优化目标函数。在结果形式上，迭代的贝叶斯风险解码方法类似于混淆网络，混淆集为相互支持或竞争的单词标注组成。为表明该解码方法在目标近似和收敛特性上具有严格的理论依据，文中证明该算法的估计风险值为理论风险值的上限，同时证明该算法在有限步迭代后收敛。在多系统联合解码方面，该迭代解码方法的显著优点是通过联合目标函数直接在不同系统中累积统计分量，避免在不同分量系统之间进行动态规划运算，使分量系统的结果充分地融合，以得到更好的解码结果。不但如此，对迭代的贝叶斯风险解码方法而言，单系统解码只是多系统解码的一个特例，因此能将单系统解码和多系统联合解码统一起来，实现更为灵活。　　为研究迭代的贝叶斯风险解码的近似特性，本文从三个方面提出改进尝试．首先为避免极端条件下初始化对解码结果造成更大的影响，文章提出基于单词的广义损失函数，该损失函数通过一控制参数改变其特性，当该控制参数为一较小正数时，该损失函数近似为概率密度函数，反之，该损失函数等价于常规的0-1损失函数。通过广义损失函数，不但使得迭代的贝叶斯风险解码实现灵活，而且使其鲁棒性得到了增强：其次，本文提出了基于模拟随机退火的迭代解码方法，通过设定不同初始温度和温度改变量搜索最优解。对比该随机迭代解码方法取得的识别结果，实证了确定性迭代解码方法具有极好的近似特性。最后，为减小因字图拓扑结构对估计风险可能造成过分近似的影响，文章分别提出前后向字图展开方法，对该假设进行了充分的验证。　　本文最后为体现研究问题的应用价值，文章对基于贝叶斯风险的系统联合解码的实际应用展开研究。它的直接动机源于贝叶斯风险准则的系统联合解码方法能显著改善识别结果，因此，用多系统的联合解码结果显然有助于无监督的系统自适应性能的改善，后者在广播语音自动标注方面有着广泛的应用前景。基于联合解码结果，文中分别用最大似然线性回归方法以及最大后验概率方法对模型参数进行自适应训练，发现经过以上两种自适应方法训练后的模型在识别性能上均有显著的提高。不但如此，模型通过最大似然线性回归自适应方法训练之后，分量模型之间依然保持性能互补特性，再次将它们联合解码，识别结果仍然能取得进一步改善。与其对应的最大后验概率自适应训练方法则不具备上述特性，通过该自适应方法训练后分量模型的联合解码出现性能下降情形。　　最后文章对全文的研究工作进行总结，并且展望下一阶段可能的研究方向。　　

其他文献

多样性护理在糖尿病患者中的措施和满意度观察

目的:观察多样性护理于糖尿病患者中应用,对患者满意度的影响.方法:挑选我院2017年5月～2018年5月区间98例糖尿病患者作为研究对象,遵循患者的入院先后顺序作以分组,分为观察组

期刊

多样性护理糖尿病护理措施护理满意度

血液透析患者实施以护士为主导的分组管理模式对临床护理质量的影响探讨

目的:探讨血液透析患者实施以护士为主导的分组管理模式对临床护理质量的影响.方法:2017年10月一2019年10月,从在本院接受血液透析治疗的患者中选择60例进行研究,按照患者姓

期刊

血液透析护士主导分组管理模式并发症率护理满意度

NaCl胁迫对碱蓬K<'+>吸收及质膜H<'+>-ATPase活性的效应

该论文以高等盐生植物碱蓬为实验材料.实验目的是:首先在不同K浓度梯度条件下,计算K的吸收速率,做出碱蓬K吸收曲线.其次比较不同浓度NaCl胁迫下,碱蓬K吸收曲线的变化,从而了

学位

碱蓬NaCl胁迫离子含量质膜H+ATPase

甘肃民勤区域荒漠—绿洲生态经济系统能值研究

甘肃民勤县属于典型的荒漠绿洲生态经济系统,发育在民勤县石羊河沿岸的绿洲在防止巴丹吉林和腾格里两大沙漠会合、防范风沙危害、保障国家及区域生态安全方面具有极其重要的

学位

荒漠绿洲生态经济系统能值分析区域资源调整甘肃民勤县太阳能值分析植被梯度分析

传染病护理管理中采用非惩罚性护理不良事件报告制度的分析

目的:研究非惩罚性护理不良事件报告制度对于传染病护理管理的作用与效果.方法:抽选我院接受并治疗的传染病患者出现的护理不良事件,抽选时间最开始由2018年1月直到2018年7月

期刊

传染病护理非惩罚性护理不良事件报告制度效果

Talienbisflavan A中间体和芳基砜的合成及生物活性研究

Talienbisflavan A是2012年从茶叶中分离得到的一个单宁酸类天然产物，生物活性测试表明其具有抗氧化和消除自由基等保健功能。本课题旨在利用有机化学方法合成天然产物talienbisflavan A，并成功得到了三个重要的中间体化合物，在中间体合成过程中，又进行相关的合成方法学研究及生物活性的测试。本论文首先以酚类物质为起始原料，利用苄基保护、还原选择性脱保护反应得到第一个中间体；以2

学位

TalienbisflavanA芳基苄基砜有机合成方法学生物活性

品管圈活动在提高急危重症患者转运安全率中的实践分析

分析急危重症患者在转运途中实施品管圈活动的价值.方法:以我院急门诊收治的急危重症患者作为研究对象,成立品管圈小组,针对现状和问题进行分析,制定并实施针对性的对策,比较

期刊

品管圈急危重症患者转运安全率

融游戏性与竞争性于一体--让体育课中的体能练习不再枯燥乏味

有些人说，在体育课的教学中，有些体能练习（如我所在地区的中考体育项目）对学生的健康发展有好处，即使学生不喜欢也必须要教、必须要学；也有人对这样的说法提出质疑？--其实我以为，这样

延伸护理对老年慢性心力衰竭患者生活质量的影响研究

目的:探讨延伸护理用于老年慢性心力衰竭中对改善患者生活质量的干预作用.方法:选取2017年5月-2019年6月本院接诊的老年慢性心力衰竭病患72例,利用随机数表法划分成研究、对

期刊

慢性心力衰竭干预作用延伸护理生活质量

针对性护理对慢性胃溃疡患者的临床效果探讨

目的:探讨慢性胃溃疡患者应用针对性护理的临床效果.方法:选取在我院进行治疗的慢性胃溃疡患者60例,根据电脑随机选取法分组,分成对照组30例行常规护理;观察组30例给予针对性

期刊

针对性护理慢性胃溃疡临床效果

贝叶斯风险解码及多系统联合语音识别应用技术研究

其他学术论文