【摘 要】
:
在各种基于短时傅立叶变换的语音增强算法中,先验信噪比被认为是一个核心参数[1-4].Ephraim和Malah提出的Decision-Directed(DD)算法对其进行了有效的估计[1].Cappé详细分析
【机 构】
:
中国科学院声学研究所,北京,100080
【出 处】
:
中国声学学会2006年全国声学学术会议
论文部分内容阅读
在各种基于短时傅立叶变换的语音增强算法中,先验信噪比被认为是一个核心参数[1-4].Ephraim和Malah提出的Decision-Directed(DD)算法对其进行了有效的估计[1].Cappé详细分析了DD算法并指出了其缺点[2],Cohen提出了Causal和Noncausal两种改进型算法[3],Plapous等人则采用一种新的分析方法并提出了TSNR算法[4].不论采用何种先验信噪比估计方法,它们的目的都是期望在抑制音乐噪声的同时尽量减小语音失真.但DD和TSNR方法都采用了一个固定的权重系数来控制先验信噪比对后验信噪比的跟踪速度[1],[4],这显然难以实现算法的最优化.Causal算法虽然等效于采用了一个随时间频率变化的权重系数,但仿真结果表明Causal算法对DD算法的改进不明显[3],而Noncausal算法中存在的长延迟使其不能用于实时通讯[3].
本文通过分析后验信噪比在各种情况下的概率密度分布,从信号检测与估计的角度揭示了DD和TSNR算法的机理,然后提出了一种全新的低计算复杂度的估计算法.这种算法规定了3种拥有不同权重系数的状态,某一特定频带的状态由其在前一帧的先验信噪比估计值和其在当前帧的后验信噪比估计值来共同决定,通过调整3种状态中的权重系数以及状态的划分标准就可以很好地在音乐噪声和语音失真之间实现折衷.
其他文献
居室装修是提高居住档次的必然要求,同时也给人们带来严重的污染问题.本文着重分析甲醛、苯及苯系物等室内空气主要污染物,经检测分析,阐明其对人体健康的危害及严重后果,并
本文对国内外电厂脱硫技术与原理进行了分析研究,对其应用情况作了简单介绍.并从脱硫工艺、脱硫效率、投资情况、技术成熟程度等方面进行了分析,指出了各自特点.在此基础上,
是中医专业课程体系中的主干课程,既是中医专业的基础课,也是中医基础课与临床课之间的桥梁课程,其教学质量是保证毕业生中医诊疗技能达标的关键,本文研究如何提高学生中医诊
●译文rn日本私立大学中,1年中途退学的学生上升到55000人,这是日本文部科学省外围团体调查的数据.
特征提取是语音识别系统的前端处理模块,它的性能,是决定整个识别系统性能好坏的重要因素之一.常用的语音特征提取方法有MFCC、LPCC和PLP等,这些方法以传统的单源激励模型[2]
吴宗济、孙国华[1]最早对普通话音节中元音与辅音间协同发音进行了研究.汉语中,对于语流中的某个音节来说,协同发音主要取决于相邻前一音节末尾的元音,以及相邻后一音节首的
啼哭是婴儿向外界传递信息的主要手段,蕴含着丰富的、与婴儿的生理和病理状态有关的信息[1].研究表明,不同婴儿基于某种特定生理、病理状态的哭声具有一定的共性.但各种类型
非线性动力学方法近些年越来越多地被用于研究语音,它聚焦于语音信号的混沌性质.其中重构相空间技术是最多使用的一个非线性动力学方法.本文介绍了语音信号非线性动力学特性
情感语音的研究经历了很长的研究历史,近些年来尤其受到关注.在情感语音合成研究方面,传统上多采用规则控制的方式,如:Mozziconacci[1]在IPO语调基础上,通过规则的方式,加入
在日常语言交流的环境中,总是不免有噪声,完成声信号向神经信号转换的内毛细胞所处的耳蜗淋巴液环境也有强烈的热噪声[1].但是,听觉系统通常都能排除这些噪声的干扰,准确的提