论文部分内容阅读
近年来,基于听觉机理的声源定位方法研究已经成为该领域的研究热点。许多工作都基于一种简化的人头模型,即利用球散射体和双传声器分别模拟人头和双耳作用的物理模型展开研究,然而目前这种基于球散射体的定位方法存在一些问题,如由于传声器摆放位置所造成的前后声源定位混淆,对球两侧声源定位的准确性明显不如对前方声源的定位,对运动声源的跟踪效果比较差等。本文针对这些问题,对人的听觉定位机理展开研究,着重分析了头转动过程对声源定位所起的作用,对传统的基于静态双耳线索的定位方法提出三个改进方案,主要工作包括:
为了解决前后声源混淆问题,文中分析了传统球散射体和双传声器定位方法中存在混淆的原因,将人在听觉定位中的头转动机制引入到声源定位技术中,即在定位过程中转动球散射体使双耳定位线索改变,这种动态变化可以有效解决声源前后混淆问题。
为了解决球两侧声源定位精度低于正前方定位精度问题,文中提出了一种主动式定位方法,即控制球散射体朝向初步估计的声源方向转动,并随时调整转动的方向和速度,使得声源落在系统的最佳定位区;这时连续对声源进行多次定位,并用多次定位结果的加权和表示最终结果,从而提高了定位精度。
在解决声源跟踪问题上,本文利用头转动过程中对声源位置的记忆效应,在确定当前时刻的声源位置时充分考虑前面的定位结果,并采用了卡尔曼滤波等跟踪算法对基于单帧信号的定位结果进行后滤波,以去除位置野点,提高了对运动声源的跟踪性能。
根据上述研究工作,本文实现了一个基于可转动球散射体和双传声器的实时声源定位跟踪系统,其性能比传统方法有较大提高。