基于矢量量化和高斯混合模型的说话人识别技术研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:wangyang2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是生物识别的一个分支,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文就小规模文本无关说话人识别的理论和技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、特征提取及识别方法等5个方面取得了较有成效的进展。建立了一个基于说话人识别的小型语音库,完成了20个人的语音样本采集工作,为算法测试奠定了物质基础。针对基于软阈值的多尺度小波去噪方法对清音的功率谱破坏较大,不利于保持语音完整性的缺点,提出了分段小波去噪方法,较完整的保留了清音的功率谱,同时充分利用了基于软阈值的多尺度小波去噪方法的去噪能力。对分形维数在端点检测中的应用进行了研究,研究表明和短时能量、短时过零率相比,分形维数具有更好的鲁棒性,适用于低信噪比环境。比较和分析了现有说话人识别特征,表明梅尔倒谱系数在单独使用时优势明显,梅尔倒谱系数及其二阶差分系数的组合具有更好的区分能力。提出了一种基于语音频谱的准基音频率,该特征依赖于浊音的谱特性,和基音频率相比具有较好的抗噪声、抗长时变动的能力。在不改变空间复杂度,不明显增加时间复杂度的前提下,利用语音无精确类别的特性,将粗糙集引入矢量量化中,降低了噪声的干扰能力。利用各语音段被噪声干扰的程度不同,提出了一种自适应补偿的高斯混合模型法,在一定信噪比范围内提高了系统的识别性能。本文用MATLAB建立了文本无关说话人识别的实验平台,实验结果表明改进算法的整体性能要优于传统算法,其中采用分形端点检测,小波去噪,MFCC特征和基于粗糙集的矢量量化方法的性能较好,在20dB信噪比下,识别率可达到98.03%。
其他文献
微机械加速度计作为一种重要的惯性器件,在汽车、消费电子、惯性制导等方面有广泛的应用前景。本文介绍了低噪声和高速全差分运算放大器的设计基本原理,另外针对本实验室的闭环加速度计系统结构,设计了其内部的运算放大器,即电荷放大器,后级放大器,单位增益缓冲器。作为全差分微加速度计检测电路的电荷放大器,必须进行低噪声设计。本文设计的低噪声全差分放大器的等效输入噪声在10.55nV/ Hz左右。而随着数据传输速
牟山镇位于宁波的西大门,区域面积38.5平方下米,辖7个行政村、1个小区,现有常住人口19539人.2019年该镇始终把生活垃圾分类工作作为践行绿色发展理念和推进精致生态宜居牟山
期刊
苦荞作为一种药食同源的作物,具有很好的营养价值和保健作用。但是有报道苦荞可能引起过敏症状,如哮喘、皮炎等,而苦荞种子中的储藏蛋白被鉴定为苦荞主要过敏原。该蛋白属于C
本文通过对荣华二采区10
期刊