面向语音增强的序贯隐马尔可夫模型时频语音存在概率估计

来源 :声学学报 | 被引量 : 0次 | 上传用户:nightcatwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音存在概率的估计是语音增强的核心技术之一,针对传统的存在概率估计方法是启发式的,没有把存在概率的估计统一到一个理论框架之中,不能保证估计最优,提出了一种基于序贯隐马尔可夫模型(SHMM)的存在概率估计方法,在每一子带上构建一个SHMM模型描述对数功率谱包络的时间序列,把谱包络序列看作一个在语音和噪声状态之间转移的动态一阶马尔可夫链,采用单高斯函数构建每一状态的概率模型,语音状态的后验概率即为语音信号的存在概率。为了满足算法实时性要求,SHMM参数估计简化为一阶回归过程,根据极大似然准则逐帧更新模型参数。实验表明:SHMM所描述的时序相关性对存在概率的估计起到关键作用,它优于一般的启发式估计方法;SHMM算法的语音增强分段信噪比(SegSNR)和对数谱失真(LSD)性能优于经典的改进型最小统计量控制递归平均(IMCRA)算法。 The speech existence probability estimation is one of the core technologies of speech enhancement. In view of the traditional method of existence probability estimation being heuristic, the estimation of the existence probability is not unified into a theoretical framework and the estimation is not guaranteed, and a Based on the existence probability estimation method of sequential hidden Markov model (SHMM), a SHMM model is constructed on each subband to describe the time series of the logarithmic power spectrum envelope, and the spectral envelope sequence is regarded as a speech signal and noise The dynamic first-order Markov chain which is transferred between states, uses the single Gaussian function to construct the probability model of each state, and the posterior probability of the speech state is the existence probability of the speech signal. In order to meet the requirement of real-time algorithm, the SHMM parameter estimation is reduced to a first-order regression process, and the model parameters are updated frame by frame according to the maximum likelihood criterion. Experiments show that the sequence correlation described by SHMM plays a key role in estimating the existence probability, which is superior to the general heuristic estimation method. The Segmental Signal-to-Noise Ratio (SegSNR) and Log Spectral Distortion (LSD) ) Outperforms the classical Modified Minimum Statistic Control Recursive Mean (IMCRA) algorithm.
其他文献
本文以我国电子商务营销开展较早的上海书城为实际背景,分析了它的解决方案和处理流程;以及营销过程涉及的关键技术,如电子签名及电子订单系统;并对其进行了评价.
该文是北京创原世纪信息技术有限公司经过在电子商务领域近三年时间的研究、探索和开发,形成了完整的电子商务体系概念和整体解决方案。文章系统地论述了电子商务层次模型和整
目的:研究青蒿素衍生物SM1044诱导弥漫大B细胞淋巴瘤细胞株SU-DHL-4凋亡的相关机制。方法:流式细胞术检测SU-DHL-4细胞的凋亡情况;蛋白质印迹(Western blotting)检测凋亡相关蛋白
上海世博会开幕后,《空军报》把世博会系列专题报道定位为一次“引领式”报道。“引领式”报道是现代传媒具有代表性的观点之一,强调以见识制胜,操作中以读者需求为核心,但又
电子商务是因特网发展的直接产物,它将传统的商务流程电子化、数字化,以电子流代替了实物流.本文介绍了最完美的电子商务,以及对物流企业带来的好处,和电子商务整体解决方案.
用电磁场原理分析计算出雷电流附近的微电子电路在有无铁网屏蔽时不因雷电误动的最大回路面积,与美国R.D.Hill提出的下限0.07Gs磁感应强度下使微电子设备误动进行了对比。计算结果表明,若雷电
鉴于近年来计算机、通讯设备等信息系统中电子设备受雷击损坏的情况日趋严重,如何对信息系统施行有效的防雷及其它过电压保护,以保证人身安全和系统的可靠运行,成为气象部门和其
为了提高格上代理签名的效率,利用无陷门签名和小范数矩阵传递技术,构造了一个代理签名方案.方案中的小范数矩阵传递技术可以控制代理签名私钥维数,使得代理签名私钥的维数小
该文结合电磁屏蔽设计实践,对电子设备结构的电磁屏蔽进行了实验研究,给出了屏蔽措施和若干实验结果。