基于Mel子带系数的文本无关的说话人识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:ryuichist
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。本文对文本无关说话人识别系统中的码本设计、特征参数提取以及鲁棒性等方面进行了研究,取得了一些研究成果。无论在矢量量化(VQ)说话人识别系统中,还是在高斯混合模型(GMM)说话人识别系统中,码本的设计都是一个比较重要的部分。在基于VQ的识别系统中,码本的优劣影响VQ算法的识别性能,在GMM识别系统中参数的初始化也涉及码本的设计。本文在LBG算法和Kohonen网络算法的基础上,提出改进的码本形成算法,改善了码本的性能。在特征参数方面,寻找新的有效的说话人识别特征参数和已有特征参数的有效组合是说话人识别参数提取研究的热点。本文通过对Mel子带系数进行修正和组合,增强了说话人识别系统中说话人之间的频带差异,提高了特征空间中类别的可分性,得到了更能体现说话人个性特征的Mel子带系数,从而提高了说话人识别系统的平均正确识别率。最后,本文在分析各个Mel子带抗噪性能的基础上,提出了鲁棒性的说话人识别算法,提高了说话人识别系统在噪声环境下的识别率。
其他文献
期刊
期刊
随着信息技术的发展,基于计算机平台的医学图像处理和识别技术也随着飞速发展起来。在医疗诊断中运用计算机处理技术,使得图像的处理和识别以及诊断精度更高,速度更快。本文以小
自动语音识别属于多维模式识别和智能计算机接口的范畴,其研究的根本目的是使机器能够听懂人类的语言。当前在实验室环境下很多系统取得了很大的进步,有着不错的性能。但是在实
近一、二十年来,电子技术领域发生了巨大的变化,表现在大量信号处理新算法的采用和电子设备的数字化、软件化,许多实际应用对算法的实时性的要求越来越复杂,计算量也越来越大,但是
足球机器人视觉系统是整个足球机器人系统中不可或缺的一部分。视觉系统担负着获得所有比赛信息的任务,是整个足球机器人系统正常运作的基础。 本文在对足球机器人视觉系统
由于宽带通信系统的广泛使用,研究超宽带通信系统的技术性能参数很有意义。在小范围内现存的本地化信息传输趋势导致了个人通信网络的创建。超宽频技术被视为这种网络的主要
期刊
目前,大部分的大规模网络应用都采用C/S(Client/Server,客户/服务器)模式,在互联网上放置少量的服务器,为互联网中的客户提供服务,如为任何两个客户之间的通信提供中转的服务。近
期刊