电话信道下应用DMFCC进行说话人识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:c2825015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。 Discriminant Mel Frequency Cepstral Coefficients (DMFCC) are a modified Mel Frequency Cepstral Coefficients (MFCC) that emphasize more discriminative information carried by the individual subbands of the speech spectrum, using an adaptive, non-uniform set of filters. The role and effect of DMFCC have been demonstrated in wideband signal applications; however, there are few examples of successful applications of DMFCC in narrowband signal applications. In this paper, speaker identification based on DMFCC is applied under the telephone channel. At the National Institute of Standards and Technology (NIST) speaker evaluation test Female Core Test Set in 2006, the system with MFCC as the characteristic parameter has an equal error rate of 7.57 % And DMFCC as the characteristic parameter is 7.25%, while the linear fusion method based on logic autoregressive method converges the system based on two different features in the fractional domain with the same error rate of 6.31% , Compared with MFCC-based systems such as the error rate decreased by 16.6%. Experiments show that the application of DMFCC directly on the telephone channel can improve the performance slightly. The theoretical analysis and experimental results show that there is a certain complementarity between the two, that is, the application of DMFCC and MFCC can significantly improve the performance of speaker recognition under the telephone channel .
其他文献
2007年4月美国次贷危机的出现,引发大批美欧金融机构陷入困境甚至破产,最终于2008年9月升级为一场全面的金融危机,迅速波及世界各地。这次危机对我国来说,弊利并存。弊主要体
人们对成语沧海桑田的意思并不陌生,但是它所包含的科学意义却知之不多。这寻常的成语中包含的深刻含义反映出古人对地质变化的认识,并且也反映出科学与人文的完美交融。这也
准确细致也是美;对这句话我感触颇深。作为一名 青年评剧演员,准确地把握人物感情的发展,准确地把握人物心理活动的变化历程,细腻入微地运用唱念做舞等表现手段,塑造鲜活的舞
采用红外线气体分析仪的测定方法研究了我国中亚热带东部马尾松光合速率和呼吸速率与环境因子的关系。结果表明: 马尾松叶片光合速率与光强和气温多元相关呈极显著水平, 其回归
第一节 简单与复合进攻 本讲已进入实战技术,在截拳道中,几乎没有任何直接的进攻。实际上,所有的进攻动作都是间接性的,或是在假动作之后发生,或以反攻方式进行的。 一次完
专业分化是指一门相对独立而又统一的专业发展成为两门或两门以上新的分支专业。专业交叉与融合是指两门或两门以上的独立专业,通过相互影响、相互渗透而形成一门新兴的专业
票友节花絮签名照相真吵“逼”走看戏袁老10月19日上午开幕式后,著名京剧表演艺术家袁世海老先生在有关人员陪同下,落座观摩席上欣赏专业演员和票友们的联袂演出。谁知,可忙坏了
4月20日,国务院总理温家宝主持召开国务院常务会议,研究部署2011年深化经济体制改革重点工作。会议指出,今年是“十二五”开局之年,要以更大的决心和勇气推进重点领域和关键
该文记叙了国内森林植物检疫对象枣球蜡蚧Eulecaniumgigantea(Shinji)在新疆维吾尔自治区的传入历史、分布、寄主和危害特点等。 This article describes the history, distribution, host and damage