文本无关的电话语音说话人确认的特征域信道补偿方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ppc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本无关电话语音的说话人身份确认的研究,以其实用性,成为当今语音识别领域中的热门课题。当今文本无关说话人确认的主流技术是以高斯混合模型(GMM)为代表的概率统计模型,由于GMM的性能依赖于训练和测试特征参数的数据分布,而在电话语音的说话人确认中,训练语音和测试语音所受到电话信道和环境的影响是不同的,由此导致的训练和测试失配会使系统性能明显下降。因此如何解决训练和测试语音的失配问题是提高说话人确认系统鲁棒性的关键。 电话信道引起的失真包括线性失真和非线性的失真,本文在特征域针分别对特征参数的线性和非线性失真提出补偿办法。 对于电话语音中存在的平稳加性噪声和信道引起的线性失真,实验研究了倒谱均值相减法(CMS)和相关谱滤波(RASTA)的补偿方法,在NIST99电话语音库上的实验表明,通过CMS和RASTA补偿后说话人确认系统的识别率提高了36%左右。 针对信道引起的非线性失真,提出了一种基于GMM语音模型特征映射的补偿方法(FM),通过对不同类型的语音采用不同的补偿来实现非线性补偿。采用GMM建立语音模型并基于“匹配补偿”思想进行的特征映射,即通过特征映射消除训练语音特征和测试语音特征中受信道影响的差异,因此各个信道的GMM语音模型都是从基准语音模型自适应获得的,并由此获得不同信道不同类语音特征的映射规则。 实验研究了语音模型的类数,GMM语音模型高斯加权(映射规则数)对说话人确认系统性能的影响。考虑到手机语音不仅有话筒类型的差异,还存在着编码方式的不同,实验研究了在话筒分类的基础上按编码方式进一步分类对系统性能的影响。
其他文献
本文讨论了目前GaSb材料的优点及存在的问题,并将其进行两个部分进行研究:第一部分为Si基GaSb薄膜的异质外延,第二部分为GaSb的电学、光学特性的测量及研究。  在第一部分中,主
随着越来越多的动物基因组测序完成,以表型筛选为主的正向遗传学方法正逐步被反向遗传学方法替代而成为功能基因组学研究的主要方法。而测序成本的降低和拼接算法的研发以及高
目的:了解安徽省医学院校女大学生乳腺癌知识、态度、行为现状及影响因素.方法:自行设计问卷,随机抽取安徽省医学院校800名女大学生进行乳腺癌知识、态度、行为调查,采用Mann
金融市场作为一个复杂系统,通过其参与者的局部相互作用,自组织地涌现出大量的宏观规律和市场行为,其中两相行为是近年来颇受研究者关注的市场行为之一,但对产生两相行为的内在机
太阳能是重要的可再生能源之一,近年来,光伏市场得到了快速的发展,但同时也存在许多挑战。其中,高纯度硅原料短缺和太阳电池的高成本是主要的问题。太阳电池产业发展的关键是
板书是指在课堂教学中教师借助书写工具(通常使用粉笔)在黑板上进行书写的一种教学行为.在多媒体技术广泛应用的今天,部分教师上课全然凭借多媒体设备教学,甚至用多媒体演示
伴随着当今网络规模的逐渐扩大,网络所能提供的服务的日益多样化。传统的网络管理模式和资源分配、访问和协调策略已不能满足用户对网络发展的新需求。同时随着IPTV业务的飞
养分回流(nutrient resorption)能够减少植物对外界养分的依赖,是植物重要的营养保存策略,在决定植被特征和群落组成以及生态系统物质循环等方面发挥了重要作用。青藏高原东缘
高温高密度热核点火是ICF研究的核心问题。根据劳森判据,激光聚变过程中,燃料面密度≥0.4/cm-10,中子飞行时间谱时间分辨对应的中子能量分辨(FWHM)达到90ke V。根据这些要求,结合
室温下NiO禁带宽度为3.6-4.0ev,与ZnO材料相比,尽管NiO的禁带宽度更大一点,但还是不能满足日盲紫外探测的需求。所以需要对NiO薄膜进行合理掺杂,使其禁带宽度增大,最好能够位