论文部分内容阅读
近年来,声源定位技术在视频会议、人工智能、安防监控、智能机器人等方面有广泛应用。传统的声源定位技术在低信噪比条件下准确率较低,易受混响的干扰,且难以处理非平稳、非线性的声音信号,实际应用场景受限。本文以室内近场声源定位为研究背景,结合国内外前沿研究进展,从时延估计和定位算法两个方面进行深入分析与研究,对传统的声源定位技术进行了改进。针对声源类型及传播性质的不同,对声源进行分类。讨论了近场源和远场源情况下分别对应的几何位置关系;同时分析了不同拓扑结构的阵列模型及其适用场景,最终构造了一种准确率较高的五元十字型空间阵列模型;建立了声音信号模型,对声信号进行采集、整形放大、归一化、预加重等预处理。针对当前声源定位技术中存在的误差大、定位效果不佳等问题,给出了一种改进MUSIC算法和目标函数搜索法相结合的定位方法。首先估算出声源到达各麦克风的时延,进而估算出声源和阵列之间的距离关系;再通过加权函数对MUSIC算法进行矢量矩阵加权,明确声源子空间,然后利用基于最小二乘法的目标函数在子空间内不断进行迭代搜索取得最优解,同时使用麦克风阵列校正法使阵列拓扑结构更合理。此类方法可以有效避免局部最优解带来的误差。针对定位技术中时延估计算法计算量大,抗噪声和混响能力差以及对非周期、非线性信号估计准确度降低的问题,给出了一种改进的二次相关时延算法。该算法在广义互相关时延算法基础上,结合EEMD和LMS算法提高信噪比,大幅度降低噪声的干扰,并利用二次相关操作来估计时延,在互相关过程中引入加权函数指数因子。仿真实验表明,与GCC算法等三种算法进行对比,改进的时延估计算法对周期或非周期信号都能达到较好的处理效果,在低信噪比条件下也能达到较高的估计精度,异常点比率约为传统算法的1/2,算法性能提升约2.5dB。改进后定位技术的误差比传统算法也有很大下降,特别是在低信噪比条件下,定位准确率明显上升。