基于深度学习和矢量量化的说话人识别研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:SunwithKing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是用来进行身份确认的一种认证技术,通常也被称为声纹识别。它通过不同说话人语音中的个性特征来识别说话人身份,具有操作方便,设备成本低等优势,并被应用于证券银行、军事国防以及公安司法等领域。深度学习是近年来发展比较迅速的一种深层机器学习模型,其本质上是多层非线性的神经网络,可以对复杂的数据关系进行建模。本文将深度学习应用在说话人识别中,优化说话人语音个性特征,提高系统性能,主要工作如下:1.介绍了深度学习基本理论并总结了该网络在说话人识别中优势和应用深度神经网络是具有多个隐层的复杂网络模型,本文阐述了深度置信网络的基本原理,并与其他模型进行了对比,进一步分析了深度神经网络在说话人识别中的优势,总结了国内外研究者对深度置信网络的研究和应用。2.研究了基于Bottleneck-VQ的说话人识别方法说话人语音时长有限会导致模型学习不充分,进而影响系统的识别率。深度置信网络可以更好地在有限的语音中捕捉到说话人的个性特征。本文通过深度置信网络提取Bottleneck特征,然后结合矢量量化方法,构成基于Bottleneck-VQ的说话人识别系统。通过仿真实验,表明在说话人语音时长不超过10s的短时条件下,基于Bottleneck-VQ模型识别率比传统VQ有10%的提升。3.研究了基于Auto-Encoder DBN-VQ的说话人识别方法噪声环境下的语音对说话人识别系统性能影响非常大,本文采用深度置信网络构造深度自动编码置信网络,可以对说话人语音中的噪声进行有效过滤,然后结合VQ构成基于Auto-Encoder DBN-VQ的说话人识别系统。实验结果证明,基于Auto-Encoder DBN-VQ的说话人识别系统比VQ以及GMM等系统在噪声条件下识别率平均提升15%。
其他文献
随着经济的发展必然带来消费的升级,旅游也是全球发展速度最快的产业之一,随着旅游休闲观念深入人心,旅游消费也势必成为消费升级的必然之选。科技飞速发展颠覆性地改变着传统产业,度假酒店作为酒店细化出来的一个分支随着旅游业的迅猛发展也增添了无限的生机。度假酒店应该顺应发展潮流,充分利用发展趋势和科学技术提供更高品质的个性化服务和具有地域特色的休憩场所。该文章是对元阳江外客栈度假酒店中地域文化特色表达进行设
目的:探究含呋喃唑酮四联疗法对根治失败的幽门螺杆菌(Hp)感染的疗效及不良反应。方法:将84例根治失败的Hp感染阳性患者随机抽取实验组与对照组各42例,对照组采用质子泵抑制剂+铋
随着"中国智造2025"转型的不断深化,现有的机电一体化课程体系无法满足智能制造对人才需要。针对这一现状,下面提出了一种智能制造项目导引的机电一体化课程实践探索方法,结
随着光的非视觉生物效应研究的深入,光环境已和人类健康紧密联系在一起。基于目前光的非视觉生物效应和光照度检测的研究,本文设计并开发了一款视觉与非视觉照度计,在满足以往视觉照度检测的功能上,增加非视觉光照度检测功能,并可用于直观评价光环境的非视觉光含量,即分析光环境的健康性。本文的研究内容包括视觉与非视觉照度计的软、硬件设计、蓝牙串口App设计和照度计检测分析四部分。(1)照度计硬件设计:本文采用以M
聚合物薄膜材料因其性能卓越、用途广泛成为纳米材料领域研究的热点之一。当聚合物薄膜的厚度减小到与高分子链尺寸相当时,高分子链处于纳米受限态。理解纳米受限态下高分子链的缠结将有助于我们准确预测纳米受限态下聚合物的黏弹行为,是发展高分子微纳米成型加工技术的理论基础。目前对纳米受限态下聚合物链缠结理论的研究还面临着极大的挑战。对纳米受限态聚合物链缠结结构、变化规律还缺乏理解。不同表征手段所得的结果还无法统
目的观察黄体酮对脑出血(intracerebral hemorrhage,ICH)后大脑基底节区神经元轴突再生的影响,探讨其具体的机制。方法1.将大鼠分为脑出血组、黄体酮小剂量组(8mg/kg)、黄体酮大剂量组(16mg/kg),假手术组为对照组。观察各组术后1、3、7、14d神经功能缺损、脑组织含水量、病理变化。2.分析术后3d各组脑血肿体积、氧化应激相关指标及凋亡相关指标。3.Western
在人口激增的今天,世界范围的粮食危机越来越严重;石油、煤炭等矿物能源日渐枯竭,因此,寻找可再生的替代能源已成为全人类迫在眉睫的课题。天然纤维素拥有可再生、产量大、环
本文对莱州湾2014年5月和9月水文、化学和生物参数进行了综合分析,探讨了浮游植物群落结构与环境因子时空分布特征及相互关系。研究表明,两个月份的盐度、溶解性无机氮(DIN)
分布式驱动是一种新型的电动汽车驱动形式,所谓分布式驱动即通过四个安装于车轮的轮毂电机直接进行驱动。分布式驱动电动汽车由于具有传动链短,空间大且控制精确等优点,正在成为研究的热点之一,开展分布式驱动电动汽车的相关研究对于我国汽车工业的发展具有重要的意义。本文以分布式驱动电动汽车为研究主体,重点开展适用于分布式驱动电动汽车的驱动防滑控制策略研究。本文具体内容分以下几个部分展开:(1)介绍电动汽车的整体
锡林河是我国典型的草原内陆河,流域所处的锡林郭勒草原属寒旱区典型草原,常年干旱,降水稀少,是该区域的主要气候特征。降水的年内分布季节性明显,冬季降水量占全年降水量的比重较大,由降雪形成的季节性积雪是该地区重要的淡水资源,其春季的积雪融水又是地区性的地下水、地表水的主要补给来源之一,但降雪也会引起雪灾和春季草原融雪性洪水等自然灾害的发生,威胁草原牧区人民的生命财产安全,影响当地农牧业发展及生态文明建