论文部分内容阅读
声纹识别技术作为仅次于掌纹和指纹识别的第三大生物特征识别技术,在金融、司法、安全和智能设备中有着广泛的应用。相对于指纹和掌纹这些生物特征识别技术,声纹识别技术具有采集方便、成本低以及算法复杂度低等优势。因此,声纹识别技术发展空间广阔,商业价值和意义重大,是国内外学者研究的一个热点。梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)是声纹识别中最常用的一种体现语音特征的参数,它是一种模仿人耳的听觉特性而提取的一种特征参数,它与线性倒谱不同,能够很好地反应语音信号的特征。本文在研究了MFCC参数的提取过程和小波包分解的相关理论的基础上,针对MFCC参数提取过程中忽略了部分高频细节和MFCC参数只能反映语音静态特征这两个问题,利用小波包分解对MFCC参数的提取过程进行改进。实验证明,改进的特征参数在声纹识别中具有较高的识别率和较好的抗噪性。支持向量机(Support Vector Machine,SVM)是一种机器学习的方法,它追求在有限的样本数量条件下得到最优的分类结果。本文在研究了SVM的核函数及其参数对SVM分类的影响的基础上,针对惩罚因子和核参数的选取,利用粒子群算法(Particle Swarm Optimization,PSO)对两个参数进行寻优,并对PSO算法进行改进,改善了算法的性能并应用到SVM中。实验证明改进的PSO算法对SVM参数进行优化,在声纹识别应用中能够达到较好的分类效果,提高了识别率。在研究了声纹识别技术中的语音信号处理、特征参数提取以及模板匹配算法的基础上,将声纹识别技术应用到说话人确认系统中,设计了一套基于说话人确认的智能门禁系统,并通过实验验证了系统的可行性。