基于模型的麦克风阵列语音增强方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:guangtoucx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号在实际通信中总会受到不同噪声的影响,导致质量下降,语音增强的目的是从带噪语音中尽可能地提取纯净的原始语音。相比单通道语音增强只能利用时频信息,麦克风阵列语音增强还可利用多路接收信号之间的空间相关性,增强指定方向的有用语音信号,抑制其他方向上的噪声或干扰,能较好地解决语音增强和失真之间的矛盾。麦克风阵列语音增强包括固定波束形成和自适应波束形成,广义旁瓣相消器(GSC)是麦克风阵列自适应波束形成的一种通用模型。GSC对空间相干的噪声具有较强的抑制能力,但是对空间非相干噪声的抑制能力不强,当非相干噪声与相干噪声并存时,输出的增强语音存在的残余噪声较多。另外,GSC是针对一般输入信号设计的,没有利用语音信号的先验知识和针对语音信号的特点进行优化。针对以上不足,本文提出基于模型的麦克风阵列语音增强算法,对GSC辅助支路的非相干噪声进行校正后建立噪声模型,并结合干净语音模型的先验知识来构造最佳语音滤波器,来对GSC主支路信号进行增强。实验表明,该算法比传统GSC性能有了明显的提高。本文的主要工作如下:1、概述麦克风语音信号处理模型,麦克风阵列语音增强算法发展历史和研究现状。2、介绍GSC和子带波束形成基础理论,以及基于统计模型的语音增强算法。3、提出一种基于统计模型的GSC自适应波束形成麦克风语音增强算法。该算法先用干净语音库训练出干净语音倒谱域和频谱域模型,再对GSC辅助支路的非相干噪声进行校正,建立噪声模型。然后利用统计模型的先验知识,计算出带噪语音模型和滤波器权重,构造出最佳滤波器,对GSC主支路的带噪语音进行语音增强。4、对所提的基于模型的GSC算法进行实验仿真,测出模型最佳分类数,并将其和TF-GSC、Frost、基于模型算法、基于后置滤波的GSC算法在不同带噪环境中进行性能对比。实验表明,在高斯白噪声条件下,该方法PESQ平均分比传统GSC平均高了0.67分,提高了31.4%。在高斯白噪声和干扰音乐同时存在的条件下,该方法比传统GSC的PESQ得分平均高0.57分,平均提高了27.8%。由此可见本文提出的基于模型的GSC算法在不同带噪环境下有较好的语音增强性能,语音质量得到了明显的改善。
其他文献
目前,由于石油化工装置的距离决定着人类的安全,所以必须设定一个合理安全的距离。本篇文章通过研究目前世界的安全距离确定方法的事例,以尽可能的降低化学品伤害为基准,提出了如
随着生态文明建设的推进,生态思想正渗入到各个领域并发挥着越来越重要的作用。针对生态理念影响下建筑设计课程教学现状问题,提出将生态理念融入建筑设计课程,从教学目标、
随着我国经济的快速发展,建筑行业也随之不断地发展,在城乡一体化改革的不断推进下,建筑工程也越来越多。建筑工程造价管理贯穿于整个建设的各个阶段与各个环节,是一项动态的
随着社会的发展,各种民用和工业建筑越来越走向高层化,而这些高层建筑在功能与结构安全上的要求都是特别严格的,所以对其基础也提出了相对高的要求。而人工挖孔桩施工技术以其特
由于近期经济飞速发展,建筑项目行业以及与建筑业直接相关的土木工程项目行业快速发展。土木工程技术的革新会对建筑工程质量的提高起极大作用,这就凸显了土木工程行业创新和
将非线性规划、随机模拟与多体系统发射动力学与引信机构动力学结合,建立了基于系统动力学仿真的引信故障自动分析系统,能够对引信机构在多种弹道环境下的动态特性进行数值仿真
目的观察二氯醋酸二异丙胺治疗酒精性脂肪肝的临床疗效。方法 67例酒精性脂肪肝患者随机分为两组,观察组34例患者给予二氯醋酸二异丙胺治疗,对照组33例患者给予阿托莫兰治疗,
采用数值模拟方法对燃气二次喷射推力矢量控制系统关闭过程中非定常效应进行研究。给出了主/次流瞬态干扰流场结构逐渐弱化消失的流场细节特性,分析了流动参数和发动机内弹道性
目的 比较EP方案(Vp-16胶囊,DDP)与CAP方案(CTX、ADM与DDP)治疗非小细胞肺癌的疗效。方法 60例晚期非小细胞肺癌随机分成两组、各30例。结果 EP组有效率为38.8%、CAP组为33.3%,两组间疗效无显著性差异(P〉0.05)。CAP组消化系统毒性作
为了研究胃癌单克隆抗体的表达及临床意义。方法用本室制备的对胃癌有较强特异性的McAbGMG1:1D1-2对151例内窥镜检组织压印片进行免疫组织化学检查。结果用本法检查组织印片中的癌细胞以及具有