【摘 要】
:
语音增强技术从带噪语音中恢复出纯净语音信号,提高语音可懂度和舒适度,是语音通信、人机交互、远程音视频会议、助听器及人工耳蜗等领域中的关键技术。经过几十年的研究和发展
论文部分内容阅读
语音增强技术从带噪语音中恢复出纯净语音信号,提高语音可懂度和舒适度,是语音通信、人机交互、远程音视频会议、助听器及人工耳蜗等领域中的关键技术。经过几十年的研究和发展,单通道语音增强和多通道语音增强都已发展了满足不同噪声场景的实用算法。 但是,不管是多通道还是单通道语音增强算法,都存在各自的缺点。多通道语空域滤波算法对模型失配非常敏感,例如传声器失配、房间混响或者导向矢量估计误差通常会导致算法降噪性能下降及语音失真增大;基于能量的多通道后滤波算法在功率谱估计中,周期图平滑策略并非最优平滑导致目标语音的明显失真;单通道语音增强算法中应用最广泛的谱减法,在语音持续时间较长时,噪声跟踪算法通常对噪声功率谱过估计,导致严重语音失真。上述问题严重制约了语音增强算法的应用,针对这些问题,本文展开了以下三方面的研究: 1)理论分析了传声器失配对一阶、二阶自适应零陷波束形成(AdaptiveNull-Forming,ANF)的时域和频域算法性能的影响,并通过仿真和实验验证了理论分析的结论,为ANF算法的工程应用提供理论依据。 2)将带噪语音信号建模为确定-随机联合模型,在条件最小均方误差准则下推导出周期图平滑所需的最优平滑系数。结果显示,最优平滑系数由信号的帧间平稳性和信号随机性共同确定。将上述最优平滑策略应用到TBRR(TransientBeam-to-ReferenceRatio)算法中,能提高PESQ得分约0.15分,且可以直接应用到其它基于能量的多通道后滤波算法中。 3)提出基于倒谱的预处理技术,在倒谱域内抑制语音中的谐频信号成分,然后变换到频域再进行噪声功率谱估计,显著降低噪声跟踪过程中的噪声功率谱过估计误差。将预处理技术应用于常见噪声跟踪算法中,显著降低语音失真,得到更高的段信噪比改善量和PESQ得分。
其他文献
伽玛射线双星是具有甚高能伽玛射线辐射的X射线双星。根据致密星性质不同,伽玛射线双星的高能辐射可能来源于微类星体的喷流或脉冲星星风与恒星星风的碰撞。伽玛射线双星中致
金属氢化物作为优良的储氢材料,受到广泛的关注。其中金属钛的吸氢密度比液氢密度大1倍多,形成的金属氢化物TiH2在能源和工业生产中具有重要的应用。氢化钛还存在氢含量可变、T
视频监控系统是智能交通系统中最重要的一部分,而背景提取和运动目标检测又是视频监控系统中的关键技术,也是后续目标识别、目标跟踪以及行为分析的基础。本文对背景提取算法和
高分辨率遥感卫星在飞行中因振动、温度和压强变化等会导致星载传感器的内部几何参数发生变化,在进行立体测绘时会带来很大的定位误差,严重制约其遥感数据的定量化应用,遥感卫星
教室里的挂钟,一分一秒地转动。我的心开始躁动起来。 想着昨天在游戏中惨败的场景,我十分愤怒:今天下午,我一定要报仇雪恨。 终于,下课铃响了。我提起书包,迫不及待地跑回家。 走到电脑前,开启电脑,点出游戏,登陆账号。 望着眼前熟悉的场景,我开始了新旅程。一步一步,我悄然逼近,心想着:这次肯定不会再失手了。 我使出必杀技,想把对手一举歼灭。 就在这千钧一发之际,忽然,显示屏黑了。 我愣住
磁暴和亚暴过程中等离子体片带电粒子的注入严重影响地球空间环境,导致环电流的增强或衰减,形成质子极光,影响中高层大气的物理化学过程。更加严重的是,这会在地表面产生一个
氦原子结构理论是氦原子的极化率、氦原子间的相互作用等理论计算工作的重要基础,本文主要研究氦原子里德堡态波函数和谱项能量的参数表达式,具体工作包括两个方面: 一是以氦
随着技术的发展,对工业应用的准分子激光器指标提出了越来越高的要求。比如半导体集成电路集成度的不断提升,要求用于集成电路光刻光源的准分子激光器满足更大的输出功率和更窄
随着电力行业的发展,输电网络的建设规模的增大,输电技术也得到了越来越多的重视。电力系统输送电能过程的稳定与否,电力供给的容量和质量,都在影响着电网未来的发展。统一潮流控制器(UPFC)以其良好的稳定性,不俗的市场潜力和电力系统快速、灵活的调控能力,逐渐被电力电子技术领域所认可,得到了快速发展的机会。统一潮流控制器既能利用补偿器进行独立控制,更重要的是利用其复合性进行联合控制,拥有稳定可靠的控制效果
中微子振荡暗示着中微子有质量,是目前实验上直接观测到超出粒子物理标准模型的现象之一,它在寻找新物理的研究中占有重要地位。中微子振荡的混合角θ13对未来在实验上研究中微