用于说话人识别的FWMC特征参数提取

来源 :中国声学学会2009年青年学术会议 | 被引量 : 0次 | 上传用户:x_schen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是利用语音信号和预先提取的说话人特征来确定或鉴别说话人身份的技术。在说话人识别系统中,提取反映说话人个性的语音特征参数是系统的关键问题之一。本文借鉴MFCC的提取过程,融合小波包分析的优点,并考虑说话人识别中各倒谱分量的相对重要性,利用Fisher准则构造了一种新的特征参数FWMC,在不增加系统计算量的同时,结合了傅立叶分析和小波分析各自的优点,具有更好的表征说话人特征的能力。
其他文献
音调是一个听觉主观感受,它使不同声音组合有一了整体的感知特征。本文通过音程确定实验发现,中心频率为倍频关系的窄带高斯白噪声组合也能像纯音组合一样,能够引起显著的音调感
目的:研究转移相关基因1(MTA1)和stomatin-like protein 2(SLP-2)蛋白在宫颈鳞癌中的表达及相关性。方法:采用免疫组化法检测40例正常宫颈组织、25例宫颈上皮内瘤变(CIN)及40
人类的听觉系统对声源定位是一个非常复杂的过程,其信息源是双耳处接收的物理声信号,因为双耳声信号包含有声源空间位置信息,并且和受试者的生理结构有关。文献在双耳极坐标下详
会议
LSF参数能够很好的表示语音频谱特征因而被广泛应用于语音编码,语音转换以及语音合成等领域。为了减小存储空间消耗,LSF参数通常采用矢量量化方法编码。本文提出了一种LSF参数
在通信系统中,语音不可避免的受到各种环境噪声的影响,为了提高通信语音的质量,研究和应用各种语音增强算法去除噪声就成为研究热点。本文提出采用DD算法估计MVSC,即软判决代替硬
对泥鳅和大鳞副泥鳅肌肉的营养成分进行测定。泥鳅的水分、灰分、脂肪、蛋白质的含量分别为7821%、112%、231%、1755%;大鳞副泥鳅的分别为7880%、113%、257%、1740%。它们的17种氨基酸总量分别为1611%和
早在二十世纪七十年代,在光学领域内许多学者就开始研究相位共轭镜技术的光聚焦特性,这是关于频域内时反方法的最早研究。本文对空气中音频声场的时反聚焦进行了深入研究,并提出
会议
说话人识别系统在实际应用中的的声学环境是多种多样的,各种噪声和失真对语音识别系统性能的影响也各不相同。一个语音识别系统可能在某些环境中具有很好的鲁棒性,但却不能适用
汉语的三字组能产性很高,词库中无法列明全部的三字词,三字组的重音规则有助于提高语音合成的自然度和普通话语调教学的效果。本文旨在考察相同声调组合的三字组的是否存在不同
盲源分离是仅利用观测混合信号来估计每个输入信道的源信号的方法。由于不需要源信号与传输信道的先验知识,盲源分离在噪声稳健语音识别,传声器语音增强,高品质数字助听器与人工
会议