基于变换域分析的噪声鲁棒声源定位方法研究及无人车应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：dlll9393

【摘要】

：

声源的方位信息对诸多智能音频系统具有重要价值。例如，智能摄像机可根据声源方位自动转向，基于麦克风阵列的语音增强系统可设计指向语音方位的空间滤波器，无人驾驶汽车可根据说

【作者】

：

雪巍

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

无人驾驶汽车声源定位变换域噪声鲁棒软硬件原型系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声源的方位信息对诸多智能音频系统具有重要价值。例如，智能摄像机可根据声源方位自动转向，基于麦克风阵列的语音增强系统可设计指向语音方位的空间滤波器，无人驾驶汽车可根据说话人方位确定语音指令的发送者，并根据外部声源方位辨识所处交通环境。通常可以利用麦克风阵列估计目标声源方位。然而，现实环境中的噪声给鲁棒声源定位带来了巨大挑战。　　本论文在认真总结现有声源定位方法的基础上，深入分析现实环境中的噪声特点，从变换域分析的角度出发，提出了一系列在不同变换域上噪声鲁棒的声源定位理论和方法。此外，针对无人驾驶汽车的特定应用场景，设计制作了车外声源定位软硬件原型系统，并进行了若干实验验证。本文的主要工作和创新点如下:　　(1)针对低信噪比无向噪声条件下的声源定位问题，在听觉谱域，提出了基于听觉谱子带加权的声源定位算法。由于目标音频和背景噪声具有不同的频率分布特性，目标音频的各个频带受噪声干扰的程度不尽相同。假设背景噪声的频带分布较为平坦，那么能量较大的频带被认为包含更多的目标音频。因此在各个子频带上分别计算声源定位结果，并提高目标音频子带计算结果的权重，可以降低背景噪声的干扰。实验表明，该算法取得了比传统算法更好的性能。　　(2)针对强方向性干扰声源存在时声源定位问题，在时频域，提出了融合历史信息和短时频谱相关性的声源定位算法。声源定位是逐帧持续过程，历史定位信息为提高声源定位的性能提供了可能性。参考历史定位结果，通过“后波束形成”可以得到抑制干扰源、增强目标音频的信号。进而，利用语音的短时频谱相关性，计算得到用于估计当前帧声源位置的时频单元权重。最后，提出了一种基于频域加权空间相关矩阵的代价函数，以利用该时频单元权重进行干扰源鲁棒的声源定位。实验结果表明，在强干扰源存在时，该算法可以取得比传统算法更加稳定和精确的定位结果。　　(3)同时针对无向噪声和有向干扰源下的声源定位问题，在双谱域，提出了基于双谱加权空间相关矩阵的声源定位算法。双谱是一种高阶统计量，由于高斯信号的高阶统计量为零，该方法理论上消除了高斯噪声的影响。此外，利用通道间双谱相位差的冗余性，可以提高宽带非高斯噪声环境下的声源定位性能。本方法将双谱相位差集成到双谱加权空间相关矩阵的数学框架内，通过决策导向的方法，计算双谱权重，以加强语音主导双谱单元的作用。最终通过对双谱加权空间相关矩阵特征值分析，找到目标声源方位。在不同噪声环境下的实验结果表明，该算法明显改善了强噪声环境下声源定位的精度，并取得了更低的均方误差。　　(4)无人车车外声源定位原型系统的制作和实验验证。针对交通环境下无人车对车外警笛声源的定位问题，本工作设计并制作了基于USB2.0和FPGA框架的麦克风阵列硬件系统，并编制了相应的下位机与上位机软件程序。此外，采用该原型系统采集了交通环境警报声的实际数据，并基于所提出的频域加权空间相关矩阵，利用警报声的长时时频相关性，设计频带权重，最终估计声源方位。实际数据下的测试结果表明，所采用的算法能够根据原型系统的实测数据，有效定位声源方位，在噪声环境下比传统算法表现出更好的性能。

其他文献

基于视觉的机器人伺服控制

该文从理论和设计的角度出发,对基于视觉的机器人控制作了研究,研究领域包括视觉伺服机器人系统的硬件设计、软件设计和伺服跟踪控制.在硬件设计部分,该文介绍了研究人员的视

学位

机器人视觉伺服图像处理跟踪控制

遗传算法及其在模糊控制系统规则优化中的应用研究

该文主要研究遗传算法及其在模糊控制系统模糊规则优化中的应用,传统的模糊控制系统的模糊规则主要是靠经验或专家来获取,因此系统的性能往往很难达到期望的要求,而遗传算法

学位

遗传算法模糊控制模糊规则

时滞系统的特征根分布及控制器设计研究

学位

汽车混合励磁无刷直流发电机可控整流技术研究

车用超级电容储能的皮带传动集成起动发电机(Belt-driven Integrated Starter Generator,BSG)系统可以较低成本实现汽车节能减排,具备广阔应用前景。混合励磁无刷直流电机(Hybrid Excitation Brushless DC Machine,HE-BLDCM)具有功率密度高、效率高、控制简单等优点,适合应用于BSG系统,其发电运行时可视为混合励磁无刷直流发

学位

皮带传动集成起动发电一体电机(Belt-driven Integrated Starter GeneratorBSG)混合励磁无刷直流发电机(Hybrid

小型电力系统发电机组计算机仿真技术研究

该论文主要从四个部分阐述了课题的研究情况,1.发电机组实用数学模型的推导,并由此推出了用于发电机三相突然短路和突加异步电机大负载仿真的差分方程;2.仿真软件画面的设计

学位

电力系统发电机仿真

基于高斯过程的机器人模仿学习研究与实现

赋予机器人像人类和其他生物一样模仿学习的能力，能够有效地解决机器人运动技能获取的问题，提高机器人的学习效率和自适应能力，是机器人仿生研究的一个重要研究方向，机器人可以通

学位

机器人模仿学学习策略自适应能力

非重度抑郁症认知加工偏向和情绪调节障碍的眼动研究

联合国卫生组织预测，到2020年导致全世界死亡和残疾的第二大因素将是抑郁症。以往对抑郁症的研究中，更多地研究重度抑郁症，对患有抑郁症，但工偏向的研究中，仍能工作、生活和学习的

学位

非重度抑郁症认知加工偏向情绪调节能力障碍识别技术

案例推理的属性权重分配和群决策重用方法研究

案例推理(Case-based reasoning，CBR)作为人工智能领域的新兴技术，已经成为认知科学、计算机科学、控制科学等学科共同关注的焦点。案例检索作为CBR的首要环节，是问题求解的关键

学位

案例推理属性权重优化分配群决策重用模式

基于人手动作捕捉的遥操作系统的设计与实现

自20世纪40年代美国阿贡实验室开始研究用于放射性材料搬运的遥控主从机械臂以来，世界各国都致力于遥操作技术的研究。随着技术的发展，如今人类在复杂环境下的探索活动越来越频

学位

机器人遥操作系统动作捕捉人机交互性

三峡工程混凝土生产浇筑过程作业调度方法研究

该文以三峡大坝坝体浇筑工程为背景,把浇所需混凝土的生产过程作为调度问题的研究对象.目的是找到一种适应生产需要的调度方法,并确定具体的调度过程.文章首先简要介绍了几种

学位

三峡大坝坝体排队论模型调度方法混凝土浇筑启发式算法

基于变换域分析的噪声鲁棒声源定位方法研究及无人车应用

其他学术论文