【摘 要】
:
近年来,基于多模态信息的语音识别系统逐渐成为研究热点。单纯依赖单模的声音信息的语音识别在无噪音环境的条件下性能较好,然而,当存在噪声或频率干扰时,其识别性能将大大降
论文部分内容阅读
近年来,基于多模态信息的语音识别系统逐渐成为研究热点。单纯依赖单模的声音信息的语音识别在无噪音环境的条件下性能较好,然而,当存在噪声或频率干扰时,其识别性能将大大降低。多模态信息可以提高对语音的感知和理解,应用视觉信息可以有效对抗环境中噪音的干扰。为了提高噪音环境中语音识别的准确性和鲁棒性,本文提出了基于语音与视觉信息融合语音识别方法。本文是在概述语音识别相关学术文献与动态的基础上,以噪声环境下自动语音识别研究为背景,建立了视听信息决策融合模型。首先,本文详述了信息融合的基本原理,分析并比较了多源信息融合的三种层次结构及主要的信息融合方法,研究了隐马尔可夫模型(HMM)在语音识别中的基本算法及语音识别的系统结构。然后,通过分析比较视听信息融合技术在特征层融合和决策层融合方法上的优缺点,提出了基于隐马尔可夫统计模型基础上的视听信息决策融合模型,此模型主体构造由两个HMM分别处理视听信息中观察值序列,同时该模型在音频模式或视频模式下也能进行识别,使它们之间具有保持内在的依赖关系。另外,本文通过采用一种加权融合策略,解决噪声导致HMM的训练与测试不匹配问题。最后通过实验验证表明视听信息决策融合模型比建立在该模型基础上的纯音频自动语音识别以及纯视频自动语音识别的性能更优,并且通过与现有的抗噪声相关方法的对比分析,得出此模型能有效克服噪声,提高识别准确率。
其他文献
使用SG-GL1400K型真空热处理炉对冷轧N6纯镍板进行了退火处理,温度分别为350、400、450、500、550℃,保温持续时间1 h后炉冷至150℃再空冷至室温。对退火后N6纯镍板的显微组
1、怎样发现Sniffer Sniffer最大的危险性就是它很难被发现,在单机情况下发现一个Sniffer还是比较容易的,可以通过查看计算机上当前正在运行的所有程序来实现,当然这不一定可
摘 要:军民融合发展是一场长期的综合领域改革创新,首先分析了长沙促进军民融合发展的形式,进而分析了存在问题,最后从协同创新视角提出发展对策。 关键词:协同创新;军民融合;对策 中图分类号:F2 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.28.002 1 发展的形式 国民经济动员和军民融合发展是兴国之举,也是强国之策。目前,长沙正立足“一带一路”重要
湖北省潜江市华山水产在废虾壳这个全新的领域异军突起,从虾壳中提取甲壳素、虾青素、氨盐、壳聚糖、壳寡糖等产品,在金融海啸中出口不降反升。去年公司出口量首次突破4000吨,销
近日,2015年梭子鱼高尔夫锦标赛在美国里诺Montraux高尔夫乡村俱乐部举行。该赛事是美巡赛的一部分,其获奖者可获得联邦杯300积分和310万美元的奖金。
企业的不断改革,面对新形势、新挑战、新机遇、新任务,如何加强企业政治工作干部,如何做企业员工的思想工作,如何做内部和外部的宣传工作,是我们面临的一个重要课题。中国经
DSA血管三维重建技术作为有力的辅助手段能够弥补DSA设备在成像上的不足,能够为用户提供具有真实感的血管三维空间信息,便于医生从多角度、多层次对病灶进行观察和分析.该技
本文介绍了目前主流的几种P2P流量检测技术,并分析了它们的优缺点,最后通过对数据挖掘技术和关联规则的介绍,提出了一种通用的P2P流量检测技术方法,该方法通过对网络数据流的
为了研究纳米级别的海泡石是否可用于去除渔业环境中的重金属镉。本研究在实验室模拟条件下,构建了暴露有2种环境浓度镉(50μg/L和100μg/L)的渔业水生生态系统,并比较了普通