论文部分内容阅读
耳聋已经成为困扰老龄化群体的一个严重的社会问题,人们对数字助听器的发展也越来越关注。在数字助听器中,数字信号处理是其的核心技术,并且其性能是影响数字助听器优劣的一个重要指标。数字助听器中的两个关键的数字信号处理技术是响度补偿和语音增强算法,因此,本论文主要以响度补偿和语音增强两大关键技术进行讨论和研究。 本文的研究工作主要体现在以下几个方面: 首先,对数字助听器中的响度补偿、语音增强、回声反馈消除以及移频压缩等关键技术进行介绍,并对这些技术中的经典算法进行了研究和分析。 其次,针对现有数字助听器中的多通道响度补偿算法容易破坏语音信号的共振峰结构,致使响度补偿后语音信号的可懂度、清晰度和舒适度降低等问题,提出了一种基于人耳听觉特性的多通道响度补偿算法。该算法采用一种可以模拟人耳耳蜗模型的Gammatone滤波器组把输入信号非均匀地分为若干个子带信号,每个子带信号的中心频率对应基底膜的特征频率点,并结合听力损失者的听力曲线,使子带信号在对应频率上的振幅最大,从而通过行波的锐化波峰在耳蜗基底膜上形成有效的听神经刺激,最终把声音信号通过压缩或者放大映射到听力损失者的听力范围内,实现听力损失者所需声音的响度补偿。 然后,针对现有的数字助听器中语音增强算法在非平稳噪声环境下,残留背景噪声的同时引入了“音乐噪声”,致使增强语音可懂度和信噪比不理想等问题,提出了一种基于噪声估计的二值掩蔽语音增强算法。该算法依据人耳听觉特性和耳蜗的工作机理理论,引入人工耳蜗模型的Gammatone滤波器组,结合谱减法和最小值控制递归平均(Minima-Controlled Recursive Averaging, MCRA)的噪声估计算法,利用人耳的听觉掩蔽特性对理想二值掩蔽阈值进行改进,得到基于二值掩蔽的增强语音。该算法能够提高增强语音的主、客观质量且性能优于对比算法。 最后,鉴于本文提出的语音增强和响度补偿均是依据人耳听觉特性,利用模拟人耳耳蜗的滤波器组进行分带,为此本文以此为依据,对两种算法进行融合,提出了数字助听器中语音增强和响度补偿的融合算法。该算法中响度补偿和语音增强过程同时处理,可以解决增强语音信号中残留背景噪声和这些噪声在响度补偿阶段被放大等问题,并在此基础上提出了一种高效的谐波恢复算法,解决在低信噪比环境下语音信号的高频谐波成分容易发生失真问题,以提高两种算法的整体性能。 本文采用NTT标准语音库中的中文子库,利用SII(Speech IntelligibilityIndex)、PESQ(Perceptual Evaluation of Speech Quality)、分段信噪比(SegSNR)以及LPA谱估计等方法对各种算法进行客观评估,并且采用主观测试对算法的可懂度和舒适度进行了评估和分析。