论文部分内容阅读
说话人认证技术是声纹识别技术研究的热点之一,其在养老金保险系统、门禁系统、远程身份认证系统等信息安全方面都得到了广泛的应用。然而,随着科技的发展,录制说话人的声音比较方便且使用简单,使得录音回放攻击对说话人身份认证的信息安全系统产生了很大的威胁。因此,研究防止录音回放攻击的说话人认证系统具有非常大的意义和迫切的需求。本文在分析现有说话人识别算法的基础上,研究了基于GMM模型和HMM模型的说话人认证系统及其仿真实现;在分析区分回放语音与原始语音方法的基础上,提取能正确表达原始语音和回放语音之间区别的特征信息,研究了基于SVM的防录音回放攻击检测系统,最终设计实现了防回放攻击检测的说话人认证总体系统。本文的主要工作内容如下:(1)分析了现有说话人认证的预处理过程,重点对语音信号进行去噪和增强的算法进行研究,编程实现了该算法并分析了该算法的实现效果;实现了语音特征参数差分MFCC的提取,分析了现有防止录音回放攻击检测的方案,研究依据信道模式噪声的长时特征来区分两种语音的不同。(2)在研究GMM和HMM基本理论、最大期望算法、K-Means聚类算法、Baum-Welch算法、Viterbi算法及概率最大化等理论技术的基础之上,分别完成了基于GMM模型和基于HMM模型的说话人认证系统的设计,完成了整个系统的训练和识别,并通过实验验证并分析了两种模型在不同的模型参数、不同语音时长下的训练和识别性能对比分析。(3)在分析SVM分类原理算法的基础上,研究分析了语音信号的信道模式噪声的提取方法和提取信道模式噪声的长时特征的算法,并对提取出的特征值进行基于SVM的训练和分类,实验分析了该算法的可行性。(4)设计实现了说话人认证防录音回放攻击检测的总体系统。该系统能完成基于GMM和HMM模型的说话人认证的训练和识别过程,实现基于SVM的防录音回放攻击检测,并且实现基于GMM和HMM模型的说话人认证与前端防回放攻击检测和后端防回放攻击检测的不同结合,并完成了包括特征提取效率、训练效率、识别效率及识别率的系统性能评估。