基于MFCC的说话人识别系统中模型参数的分类

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:song656334704
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别可以被看作是语音识别的一种,是当前的研究热点之一。说话人识别是包含在语音中的同说话人有关的信息来自动识别说话人,它的具体应用可以分为两大类,一类是说话人辨认,这类问题系统要完成的任务就是把说话人的信号特征与数据库中的众多人员的模板相比较,从而确定说话人的身份;另一类是说话人确认,这类问题要求说话人进行身份说明,系统的任务就是把输入信号与库中的相应身份的声音模板进行匹配以确定说话人身份的真伪。可见,辨认要做的匹配是一对多的,而确认所做的匹配则是一对一的,所以说话人辨认对系统的要求较高,尤其是数据库存储的模板数比较大的时候,这个问题尤为突出。因此,为了提高辨认识别率,本文提出了一种在基于MFCC说话人识别系统中对模型参数进行分类的思想。   本文在这方面主要做了以下工作:   (1)文章实现的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(MFCC)作为特征参数。实验比较了MFCC、△MFCC+MFCC分别与VQ、加权的VQ(WDMVQ)相结合的识别率。   (2)对基本的VQ识别算法进行了改进,研究了一种新的矢量量化识别方法,即基于方差的加权失真测度的矢量量化。   (3)在训练阶段,利用标准语音库里的音频信号将说话人参考模型进行分类,采用不同码字进行识别,通过实验验证分类说话人识别的优越性。
其他文献
本文通过对荣华二采区10
期刊
近年来,伴随数据业务的需求膨胀,现有网络已越来越不适应业务的要求,为此提出了下一代网络NGN(Next Generation Network)的概念。下一代网络是集话音、数据、传真和视频业务于一
摘要:鉴于当前初中道德与法治生活化教学存在误区,导致该项教学效果不佳,不利于学生道德与法治素养初步形成,本文将着重分析初中道德与法治生活化教学的误区,进而探究如何规避误区,并提出可行的意见,希望对于提高初中道德与法治生活化教学水平能够起到抛砖引玉的作用。  关键词:道德与法治教学;生活化;有效措施  初中时期正是学生道德与法治素养初步形成的关键时期,良好的开道德与法治生活化教学是非常重要的,不仅能
荷电粒子加速器技术的不断发展,使得逐束团电荷量测量、非截断束团截面测量技术被提上日程,对束测系统的设计提出了新挑战,基于以上原因,本论文提了出利用BPM探头信号设计算法求
时反方法在最近几十年内已经得到了迅速发展,并且被广泛应用于医学上的超声成像和治疗、水下声学、非破坏性检测、房间声学、无线电通信等领域中。由于有限的阵列孔径,常规时反
学位
胰蛋白酶是一种动物来源的蛋白水解酶,具有高度的专一性,只水解L-型精氨酸和L-型赖氨酸的羧基组成的肽键。胰蛋白酶是所有胰脏蛋白酶原的共同激活剂(包括其自身的前体胰蛋白酶原)。作为一种重要的消化酶,胰蛋白酶在医药、食品、工业及有机合成中都有着广泛的应用,人们也对其进行了深入的研究。现在的热点主要集中于天然胰蛋白酶抑制剂。 生物碱是一类含氮杂环的碱性天然有机物,广泛存在于植物体内,大多数具有重要
以视频信息为主的多媒体技术是21世纪最具有时代特征和最富有活力的研究和应用领域之一。人们对获取视频图像信息的执着和对视频图像信息的需求是越来越强烈;同时,通信、计算机
搜索引擎是当前互联网的基础应用,它帮助用户在海量数据中进行查询。但是传统的全网搜索模式存在索引更新困难和查询准确度低等局限性,主题搜索的出现和发展可以有效弥补上述不
学位
随着无线通信技术的进步与人们的需求不断增加,无线通信的速度,质量等要求不断增大。多天线通信系统即可以改善系统性能,又可以在不增加带宽的情况下,提高通信系统的容量和频
本文通过对荣华二采区10
期刊