基于后验信噪比概率密度分布的先验信噪比估计

来源 :中国声学学会2006年全国声学学术会议 | 被引量 : 0次 | 上传用户：ji5261

【摘要】

：

在各种基于短时傅立叶变换的语音增强算法中,先验信噪比被认为是一个核心参数[1-4].Ephraim和Malah提出的Decision-Directed(DD)算法对其进行了有效的估计[1].Cappé详细分析

【作者】

：

周崟李晓东

【机构】

：

中国科学院声学研究所,北京,100080

【出处】

：

中国声学学会2006年全国声学学术会议

【发表日期】

：

2006年10期

【关键词】

：

信噪比概率密度先验信噪比估计语音增强算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在各种基于短时傅立叶变换的语音增强算法中,先验信噪比被认为是一个核心参数[1-4].Ephraim和Malah提出的Decision-Directed(DD)算法对其进行了有效的估计[1].Cappé详细分析了DD算法并指出了其缺点[2],Cohen提出了Causal和Noncausal两种改进型算法[3],Plapous等人则采用一种新的分析方法并提出了TSNR算法[4].不论采用何种先验信噪比估计方法,它们的目的都是期望在抑制音乐噪声的同时尽量减小语音失真.但DD和TSNR方法都采用了一个固定的权重系数来控制先验信噪比对后验信噪比的跟踪速度[1],[4],这显然难以实现算法的最优化.Causal算法虽然等效于采用了一个随时间频率变化的权重系数,但仿真结果表明Causal算法对DD算法的改进不明显[3],而Noncausal算法中存在的长延迟使其不能用于实时通讯[3]. 本文通过分析后验信噪比在各种情况下的概率密度分布,从信号检测与估计的角度揭示了DD和TSNR算法的机理,然后提出了一种全新的低计算复杂度的估计算法.这种算法规定了3种拥有不同权重系数的状态,某一特定频带的状态由其在前一帧的先验信噪比估计值和其在当前帧的后验信噪比估计值来共同决定,通过调整3种状态中的权重系数以及状态的划分标准就可以很好地在音乐噪声和语音失真之间实现折衷.

其他文献

甲醛、苯及苯系物室内空气污染分析与防治对策

居室装修是提高居住档次的必然要求,同时也给人们带来严重的污染问题.本文着重分析甲醛、苯及苯系物等室内空气主要污染物,经检测分析,阐明其对人体健康的危害及严重后果,并

会议

室内空气污染甲醛苯系物人体健康居室装修

电厂燃煤锅炉脱硫技术的探讨

本文对国内外电厂脱硫技术与原理进行了分析研究,对其应用情况作了简单介绍.并从脱硫工艺、脱硫效率、投资情况、技术成熟程度等方面进行了分析,指出了各自特点.在此基础上,

会议

燃煤锅炉脱硫技术脱硫工艺脱硫效率

以提高学生动手诊察能力为中心,努力提高中诊教学水平

是中医专业课程体系中的主干课程,既是中医专业的基础课,也是中医基础课与临床课之间的桥梁课程,其教学质量是保证毕业生中医诊疗技能达标的关键,本文研究如何提高学生中医诊

会议

日本私立大学中途退学达55000人——私立学校振兴事业团对全国的最初调查

●译文rn日本私立大学中,1年中途退学的学生上升到55000人,这是日本文部科学省外围团体调查的数据.

期刊

日本私立大学退学私立学校团体调查译文学生数据科学

双源谐波模型的语音信号清浊音分离

特征提取是语音识别系统的前端处理模块,它的性能,是决定整个识别系统性能好坏的重要因素之一.常用的语音特征提取方法有MFCC、LPCC和PLP等,这些方法以传统的单源激励模型[2]

会议

双源谐波模型语音信号清浊音语音识别

普通话双音节中第二音节辅音对第一音节韵母u共振峰轨迹的影响

吴宗济、孙国华[1]最早对普通话音节中元音与辅音间协同发音进行了研究.汉语中,对于语流中的某个音节来说,协同发音主要取决于相邻前一音节末尾的元音,以及相邻后一音节首的

会议

普通话双音节声学

婴儿啼哭声的声学特征

啼哭是婴儿向外界传递信息的主要手段,蕴含着丰富的、与婴儿的生理和病理状态有关的信息[1].研究表明,不同婴儿基于某种特定生理、病理状态的哭声具有一定的共性.但各种类型

会议

啼哭声声学声学特征

语音信号非线性动力学特性与语音学特性之间的关系

非线性动力学方法近些年越来越多地被用于研究语音,它聚焦于语音信号的混沌性质.其中重构相空间技术是最多使用的一个非线性动力学方法.本文介绍了语音信号非线性动力学特性

会议

语音非线性动力学语音学特性

情感语音韵律自动生成方法的研究

情感语音的研究经历了很长的研究历史,近些年来尤其受到关注.在情感语音合成研究方面,传统上多采用规则控制的方式,如:Mozziconacci[1]在IPO语调基础上,通过规则的方式,加入

会议

情感语音自动生成语音分析

内毛细胞到听神经信号转换中的随机共振

在日常语言交流的环境中,总是不免有噪声,完成声信号向神经信号转换的内毛细胞所处的耳蜗淋巴液环境也有强烈的热噪声[1].但是,听觉系统通常都能排除这些噪声的干扰,准确的提

会议

内毛细胞听神经信号转换随机共振

基于后验信噪比概率密度分布的先验信噪比估计

其他学术论文