【摘 要】
:
语音识别系统的抗噪声性能是影响系统实际应用效果的关键因素之一。本文针对这一问题,包括识别系统对卷积噪声及加性噪声的鲁棒性展开研究,具体工作集中在语音增强、特征后处理
论文部分内容阅读
语音识别系统的抗噪声性能是影响系统实际应用效果的关键因素之一。本文针对这一问题,包括识别系统对卷积噪声及加性噪声的鲁棒性展开研究,具体工作集中在语音增强、特征后处理以及抗噪声模型训练这三个方面。
在语音增强方面,文中首先分析了传统方法中增强优化过程所存在的问题,即以短时谱误差为优化对象,进行干净语音谱的估计。然而,语音识别所使用的特征,并非幅度谱,而是美标度倒谱系数。基于此,本文提出将各种估计优化准则,包括最大似然、最小均方误差等运用在美标度能量谱上。实验结果表明,基于这种优化准则的增强方法在抗加性噪声方面性能较传统方法具有更强的鲁棒性。
在特征后处理方面,本文实现了特征的直方图均衡方法,并与倒谱均值归一化方法进行了比较。分析表明,直方图均衡方法通过将特征分布非线性映射到标准高斯分布上,不仅能够去除卷积噪声,而且有利于降低加性噪声的影响。通过汉语连续语音识别评测,其性能明显优于倒谱均值归一化方法,相对错误率下降近20﹪。
在模型训练方面,文中采取了对训练语料进行加噪及去噪处理的方法,使训练模型与经去噪处理的待识别语音最大程度匹配。这种方法结合上述语音增强与特征后处理方法,使识别系统的性能进一步得到提高。
其他文献
转基因技术日益成为生物性状和质量改良的重要手段,并为人类带来巨大收益,但是由于目前大多使用抗生素抗性基因和抗除草剂类基因作为标记基因,对环境和人类健康存在或潜藏着
大功率激光器的发明和海水对蓝绿光的低损耗窗口的发现,使得水下激光通信成了研究的热点。但在水下激光通信中,点对点通信在实际应用上存在实时定位困难、易受环境(水体)干扰
数字图像编码(压缩)多年来都是一块活跃的研究领域,已有很多成功的编码技术被开发出来,其中不少技术被诸如JPEG和JPEG2000这样的国际标准所接纳。JPEG2000是新一代图像编码国际
互联网的蓬勃发展,对人们的生活、工作、学习影响越来越大。在给人们带来便利的同时,也带来很多问题:黑客在互联网上肆意妄为,越来越频繁的出入、破坏各类网站;在互联网上传
盐胁迫是限制农业作物产量的环境因素之一。盐胁迫不仅影响作物的生长发育过程还会影响其产量,因此培育耐盐的植物品种具有重要意义。棉花是重要的经济作物,利用基因工程方法培育出优良的耐盐棉花品种,并在盐碱地大量种植有利于我国盐碱地的开发和利用。分别过表达来自大肠杆菌的胆碱脱氢酶基因betA、玉米的磷脂酰肌醇合成酶基因PIS、盐芥的液泡膜H+-PPase基因TsVP能够显著提高植物的耐盐性。由于betA、T
同步数字体系(SDH)是新一代的数字传输体制,它是通信容量迅速增长、对灵活联网要求日益提高的产物。多电平正交幅度调制(MQAM)因具有较高的频带利用率和功率利用率被广泛应用
低密度奇偶校验(LDPC)码是一种具有稀疏奇偶检验矩阵的线性分组码,它在与基于置信传播(BP)迭代译码算法相结合的条件下具有逼近Shannon限的性能。该码的译码复杂度与码长成线
从母国的角度来看,成立主权财富基金的主要意图在于帮助母国实现其宏观经济政策目标;从国际层面来看,主权财富基金既能产生金融稳定作用,也会产生冲击金融稳定的负面作用
Fr
移动机器人研究是机器人学中的一个重要分支。移动机器人避障与路径规划又是机器人研究的一个重要方向。目前,随着机器人技术的不断进步,机器人学科越来越具有强大的生命力,它在
水母雪莲(Saussurea medusa Maxim.)和新疆雪莲(Saussurea involucrata Karel.et Kir.)是我国珍稀的药用植物资源,具有清热解毒、止痉镇痛、敛伤、消肿及治疗热病、风湿等多种