论文部分内容阅读
语音信号的盲分离在近年来成为信号处理的一个热点问题,因为其在语音识别,高质量的手机通信以及远程会议系统中都有着广泛的应用前景。基于瞬时混合的语音信号盲分离已经相对成熟,而在实际环境中,由于房间的回响和反射,使得语音信号不再是简单的瞬时混合,而成为卷积的混合,再加上语音信号本身的特性,使得卷积语音信号的盲分离变得异常困难。基于卷积混合信号的盲分离目前还处于实验室阶段,还有很多待解决的问题。卷积语音信号的频域盲分离方法可以将时域中卷积信号转换为频域中的瞬时混合信号,简化了盲分离的模型。但是,在频域盲分离算法中,由于解混是在各个频点上单独进行的,各个频点上解出的源信号存在的次序不一致问题,是亟待解决的问题,同时,频域盲分离算法大多为批处理算法,很少有在线算法,并且在线算法的收敛速度也较慢,这些都是频域盲分离算法中需要改进的地方。
针对以上问题,本文在以下几个方面进行了工作与创新性的探索。
(1)语音信号在时域中的特点已经得到了广泛的研究,而针对频域中的特点的研究并不多,因此本文针对卷积混合信号在频域中进行盲分离时所需的条件,通过实验研究了语音信号在频域中所具有的特性,并且将这些特性应用于频域的盲分离算法中。
(2)在频域的盲分离算法中,各个频点次序不一致问题(Permutation)仍然是一个未得到很好解决的问题,本文利用语音信号在时频点上的稀疏特性,将时频分析引入频域的盲分离算法,作为独立元分析的分离信号的参考信号,来解决各频率点上次序不一致问题,新算法在分离的效果上优于传统的相关算法和DOA算法,同时,比起单独用时频二元掩模的方法减少了失真。
(3)由于传统的解决次序不一致问题大多为批处理算法,因而导致频域盲分离的算法不能在线进行,本文利用语音信号的传播特性,利用源信号到接收器的波达方向(Direction of Arrival,DOA)作为约束条件,来实现频域的在线算法,新算法可以实现在线分离,并且不像原批处理的DOA算法需要知道接收器的位置信息。
(4)频域的盲分离算法还存在一个重要问题就是算法的收敛速度,传统的频域盲分离算法虽然能够达到收敛,但是收敛速度并不令人满意,本文提出了基于四阶统计量的定点盲分离算法,大大提高了收敛速度,并且收敛效果良好。