说话人确认技术及其应用研究

被引量 : 0次 | 上传用户:xiangceng666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人确认技术是一种生物识别技术,目前越来越受到人们的关注。如今随着多媒体时代的来临,说话人确认技术逐渐从实验室转移到实际应用中。但是语音数据的不足、背景噪声和传输信道不匹配等因素对说话人确认系统的实用化造成影响。本文针对此问题进行了研究,主要的研究内容归纳如下:   首先,论文根据HTK软件支持多种类型的特征参数和训练高斯混合模型等特点,构建了基于高斯混合模型-通用背景模型(GMM-UBM)说话人确认系统。但是传统的GMM-UBM系统容易受噪音和信道影响,而基于高斯混合模型超向量的SVM说话人确认系统不仅能降低噪声和信道作用对识别效果的影响,还优化了说话人确认系统的评分方法,从而提升了系统的识别性能。   其次,针对训练语音数据和测试语音数据的信道不匹配的问题,论文采用NAP算法消除输入特征中信道因子,从而减少因信道不匹配造成的影响,突出说话人的特征因素,扩大不同说话人特征之间的距离。   最后为了解决因语音信号数据的不足对系统造成的影响,论文在基于GMM超向量的SVM说话人确认系统的基础上,提出了三种不同的语音分段方法,它们能在不增加用户负担的情况下增加语音数据。三种方法分别为基于时间间隔的语音分段(Utterance Partitionbased on Interval,UP-I),平均语音分段(Equally Utterance Partition,UP-E)和基于声音向量重采样的语音分段(Utterance Partition with Acoustic Vector Re-sampling,UP-AVR)。通过在美国国家标准与技术研究所(NIST)2002年说话人识别数据库上的实验证明,三种不同的语音分段方法不仅有效地解决了因缺少语音数据而造成SVM中不同类别之间样本点数不平衡的问题,还提高了系统的识别率。
其他文献
立体视觉技术中的深度测量在三维场景恢复、三维重建中发挥了重要作用。目前,随着测量技术的发展,深度测量可大量应用在无损检测、预知维护、机器人导航、医学分析、虚拟现实、
本文研究了四种不同原理的语音增强算法,包括基于语音生成模型的维纳滤波法、基于统计模型的最小均方误差法、基于信号子空间的方法,小波变换法。文中详细介绍这四种算法的原
现网话务量的快速增长,导致位置更新、双频切换量等问题突出,在小话务量情况下正常的网元设备和参数设置,在中、大话务量情况下可能成为瓶颈。通过分析2009年上半年集团网测
本文以某空地反辐射导引头预研课题为应用背景,利用仿真数据和导引头外场挂飞实测数据,深入研究了地杂波背景下毫米波高分辨主动导引头距离扩展目标的检测问题。主要内容包括
学位
上海光源是先进的第三代中能同步辐射装置。联锁保护系统是上海光源中为保护重要设备而设置的控制子系统,快联锁保护系统是整个上海光源联锁保护系统的一部分,其联锁响应时间
学位
网格计算环境实现了各种不同地理位置的同构或者异构资源的共享。如何进行这些共享资源的管理是网格的核心问题,而资源分配是资源管理的一个重要问题,特别是如何将多个资源同
在中国目前的交通运输中,公路和铁路运输占有较大比重,公路铁路运输网络中包含有各种类型和规模的桥梁,这些桥梁的安全运行对于中国交通运输有着十分重要的意义。由于外界环境等
学位
汽车后视系统作为汽车安全辅助驾驶系统(Car Safetys Driving Assistant Systems)中的一个重要组成部分,近年来得到了广泛的关注,涌现出许多新方法。本文采用多摄像头图像拼接
立体显示技术历史悠久,经历了漫长的发展过程,由于其逼真的显示效果,广泛的应用范围,在各个领域都发挥着巨大的作用,人们对于立体显示技术的研究也越来越深入。进入2010年,随着多部
羊草(Leymus chinensis(Trin.)Tzvel.),又名碱草,是禾本科赖草属根茎型多年生禾草。羊草在自然状态下,无性繁殖占绝对优势,限制了人们对其的利用。本文以松嫩草地生长的羊草