【摘 要】
:
语音是人类进行交流的主要工具之一,是人与人、人与机器之间进行沟通的重要桥梁。如何高效的实现语音传输、存储或通过语音实现人机交互,是语音信号处理领域的重要研究课题之
论文部分内容阅读
语音是人类进行交流的主要工具之一,是人与人、人与机器之间进行沟通的重要桥梁。如何高效的实现语音传输、存储或通过语音实现人机交互,是语音信号处理领域的重要研究课题之一。语音噪声抑制技术是语音处理的一个重要技术,多年来学者们不懈努力,寻求各种优良的语音增强算法。本论文主要研究背景噪声下语音噪声抑制技术,其目的是改进语音质量,提高语音清晰度和可懂度,在抑制背景噪声的同时尽量减小收听者听觉疲劳。论文首先研究了语音端点检测方法,分析比较了各种端点检测算法的检测性能。改进了基于自相关函数的端点检测算法,论文还进行了算法的仿真实验,实验结果验证了改进算法较传统算法的检测效率有很大提高。噪声抑制过程中最重要的环节是语音增强,大多数实用的语音增强算法均是由精确的噪声估计方法和良好的增强算法来实现的。所以在语音增强部分文中先介绍了一种有效的噪声估计方法。在增强算法中文中重点介绍了基于频谱减法的语音增强算法、基于最小均方误差(MMSE)的语音增强算法以及结合了人耳掩蔽效应的语音增强算法。经仿真实验发现在机载背景下,传统的谱减算法和基于最小均方误差的算法效果并不理想。而基于人耳掩蔽效应的算法效果优于这两种算法,但是这种算法的复杂性限制它的实用性。因此文中把传统谱减和噪声估计方法相结合,实验验证此方法能很好的跟踪机载背景噪声特性,语音增强效果明显,同时运算效率高于其它的算法。论文最后根据一种新的语音可懂度的相对度量方法,综合考虑各算法的优劣,选择适合机载背景的实用语音增强方法。同时为改善收听者对噪声抑制后输出语音的舒适感,文中提出在带噪语音的无音段添加舒适背景噪声,有效改善了收听者听觉疲劳。论文根据分析结果设计了完整的在机载背景下的噪声抑制流程,在Matlab仿真验证其可行性的基础上,再在硬件平台上验证其有效性和适用性。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)图像已广泛地应用于国民经济和国防科技等领域,相干斑抑制是SAR图像处理中一个非常重要的预处理部分;为了得到便于解译的SAR图像
近年来,运动视频分析已成为计算机视觉领域里的一个研究热点和难点。本文作者在充分了解相关研究工作的基础上,针对跳水运动视频的特点,研究了存在全局运动的视频运动目标分
无线射频识别(RadioFrequencyIdentification,RFID)技术,是一种利用射频通信实现的非接触式自动识别技术。RFID标签具有体积小、容量大、寿命长、可重复使用等特点,可支持快速读
伴随着Internet的高速发展及各种数字化设备的普及,现代社会中多媒体信息的数量迅猛增长,使得人们越来越多的接触到大量具有丰富内涵的多媒体信息。为了方便地从海量的信息集
生物医学图像的研究方兴未艾,并且随着各种成像技术的不断地发展,为生物医学成像提供了很多新的方法。其中,图像融合方法能为整合多模态和运用新模态图像信息提供帮助,其在基
目前无线频谱资源采用固定分配方式,导致在某些频段利用率低,频谱呈现稀疏状态。然而,授权用户和认知用户对频谱资源共享可以提高频谱使用效率。频谱共享首要任务是对空闲频
虚拟听觉空间(VirtualAuditorySpace,简称VAS)可以根据人类心理听觉特征,通过双声道播放系统再现声源的空间信息。与头相关传递函数(HeadRelatedTransferFunctions,简称HRTFs)描
实时目标跟踪技术是计算机视觉领域中的研究热点之一。随着公共安全需求的提高,视频监控系统在国民生活的许多方面得到广泛应用,如安全检测、机器人导航、人机交互、军事应用
图像分割是图像处理和计算机视觉中的基本技术,是大多数图像分析及视觉系统的重要组成部分,也是成功进行图像分析、理解与描述的关键步骤。在图像分割的若干方法中,基于概率
GSM-R铁路综合数字移动通信系统是各种列车运行控制信息的传输平台。为保证列车的行车安全,需要GSM-R通信系统具有可靠的网络质量。因此如何保证网络的可靠性,是当前GSM-R通信