【摘 要】
:
语音是人的自然属性,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能,说话人识别具有广泛的应用前景。本文主要讨论了说话人识别的特征参数提取
论文部分内容阅读
语音是人的自然属性,每个人的语音都带有强烈的个人色彩,这使得通过分析语音信号来识别说话人成为可能,说话人识别具有广泛的应用前景。本文主要讨论了说话人识别的特征参数提取、说话人识别系统组成、基于矢量量化(VectorQuantizatioN,VQ)的说话人识别方法及其改进方法、基于高斯混合模型(GaussianMixture Model,GMM)的说话人识别方法及其改进方法,并对实验结果进行了讨论。
为了与GMM算法的识别结果进行对比,本文首先对VQ方法作了讨论,在训练VQ码书的传统的LBG算法基础上应用粒子群优化算法(Particle SwarmOptimizatioN,PSO)进行改进,得到PSO-LBG算法。另外,本文从两个方面改进了传统的GMM算法,分别是基于能量分类的GMM方法(Power ClassifiedGMM,C-GGMM)和基于特征空间分类的GMM方法(Feature Space ClassifiedGMM.F-GMM)。
PSO-LBG方法的原理就是利用PSO算法产生初始码书,然后根据PSO算法中的迭代公式产生新的解(即新的码书),对该新解利用LBG算法进行优化,将优化后得到的结果再输入到PSO算法中产生新解,直到产生足够好的码书为止。
C-GMM方法是根据语音帧能量对语音数据进行分类,在抗噪性能方面有着明显的优势,并且在信噪比较低的情况下系统的鲁棒性较好;F-GMM方法在特征空间对语音数据进行分类,描述说话人个性特征的信息比较丰富,在信噪比较高的时候系统的识别率很高,但是缺点是在信噪比低的时候系统鲁棒性得不到保证。
其他文献
随着城市的不断发展,城市土地资源变得越来越紧张.为了能充分利用土地资源,高层建筑不断涌现,并在我国的建筑市场上快速发展.然而高层建筑由于其本身的高度原因,因此,对其建
随着TD-SCDMA的普及,特别是一些新的应用如互动游戏、视频共享以及网络电话的出现,对上行链路容量的需求不断增大,HSUPA的产业化成为了必然趋势。为了HSUPA的产业化,能够支持
【摘 要】本文主要介绍了门式刚架钢结构在结构设计中不论是主结构还是次结构,荷载取值错误、漏输错输的情况。 【关键词】 门式刚架;荷载;设计 1 门式刚架的特点 门式刚架是梁、柱刚性连接的单层刚架结构,具有结构简单、受力合理、自重与用钢量小而使用空间大、施工方便等特点,并便于工厂化、标准化的加工制作,与压型钢板等轻型围护材料相配套的轻型门式刚架建筑系列已得到广泛的应用。其适用范围为轻型工业建筑
传统网络发展越来越复杂庞大,已经不能满足业务对网络资源灵活调度的需求,并且由于业务的快速发展,网络中流量的剧增,对流量的灵活控制的需求越来越迫切,而且,如此巨大的网络
语音增强是语音信号处理的重要分支,也是语音编码、语音识别、语音合成等技术的重要预处理环节。在众多的语音增强算法中,谱减法(Spectral Subtraction)由于其简单有效成为一
工程项目管理是以项目管理为中心,以项目目标为导向,通过全方位地建立项目组织体系、项目计划体系、项目过程控制体系等,对项目进行有效的计划、组织、指挥、协调及控制.支撑
抽油机电机远程监控系统对于实现油田开采设备的自动化管理具有重要意义,由于油井数量庞大且位置分散,低成本、高可靠性的信息传输通道是远程监控系统的关键。本文针对抽油机
以蜂窝系统的出现为起点,伴随着集成电路技术、微机技术和通信技术的发展,移动通信已全面进入3G时代。第三代移动通信系统的前进方向是全球化、综合化和个人化,以WCDMA,CDMA2
协作MIMO是LTE-Advanced的一项关键技术,能够显著增强小区边缘用户的性能,因此受到人们的广泛关注和深入研究,将在未来的第四代移动通信中扮演重要角色。协作MIMO技术的关键
作为解决无线频谱资源日益稀缺问题的一个关键技术,认知无线电技术允许认知用户在不干扰授权用户通信的前提下动态接入到授权通信频段进行通信,从而提高有限频谱资源的利用率