电话信道下应用DMFCC进行说话人识别

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：c2825015

【摘要】

：

鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFC

【作者】

：

王刚郑方

【机构】

：

清华信息科学与技术国家实验室技术创新与开发部语音和语言技术中心,清华大学计算机科学与技术系,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2009年10期

【关键词】

：

DMFCC 信道倒谱系数电话信道鉴别性说话人识别特征参数子带说话人融合方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。 Discriminant Mel Frequency Cepstral Coefficients (DMFCC) are a modified Mel Frequency Cepstral Coefficients (MFCC) that emphasize more discriminative information carried by the individual subbands of the speech spectrum, using an adaptive, non-uniform set of filters. The role and effect of DMFCC have been demonstrated in wideband signal applications; however, there are few examples of successful applications of DMFCC in narrowband signal applications. In this paper, speaker identification based on DMFCC is applied under the telephone channel. At the National Institute of Standards and Technology (NIST) speaker evaluation test Female Core Test Set in 2006, the system with MFCC as the characteristic parameter has an equal error rate of 7.57 % And DMFCC as the characteristic parameter is 7.25%, while the linear fusion method based on logic autoregressive method converges the system based on two different features in the fractional domain with the same error rate of 6.31% , Compared with MFCC-based systems such as the error rate decreased by 16.6%. Experiments show that the application of DMFCC directly on the telephone channel can improve the performance slightly. The theoretical analysis and experimental results show that there is a certain complementarity between the two, that is, the application of DMFCC and MFCC can significantly improve the performance of speaker recognition under the telephone channel .

其他文献

浅析后危机时期我国经济发展的若干重要方略

2007年4月美国次贷危机的出现,引发大批美欧金融机构陷入困境甚至破产,最终于2008年9月升级为一场全面的金融危机,迅速波及世界各地。这次危机对我国来说,弊利并存。弊主要体

期刊

危机时期经济发展美国次贷危机金融机构金融危机人民币升值国际贸易顺差宏观经济平衡经济增长通胀压力

螺旋CT结合呼吸门控对矽肺形态与功能变化的研究

期刊

矽肺患者呼吸门控呼吸功能试验尘肺诊断隆突病变特征混合性通气障碍用力呼气容积肺功能指标肺间质病变

沧海桑田——古代对海陆变迁的认识

人们对成语沧海桑田的意思并不陌生,但是它所包含的科学意义却知之不多。这寻常的成语中包含的深刻含义反映出古人对地质变化的认识,并且也反映出科学与人文的完美交融。这也

期刊

海陆变迁地质变化神仙传李约瑟上升海岸地质学基础江苏省连云港亚平宁山脉唐时梦溪

热爱我所扮演的人物

准确细致也是美;对这句话我感触颇深。作为一名青年评剧演员,准确地把握人物感情的发展,准确地把握人物心理活动的变化历程,细腻入微地运用唱念做舞等表现手段,塑造鲜活的舞

期刊

唱念七姑情感变化思想性格历史环境心理活动变化历程革命历史题材秀娘艺术形象

中亚热带东部马尾松叶片光合及呼吸的研究

采用红外线气体分析仪的测定方法研究了我国中亚热带东部马尾松光合速率和呼吸速率与环境因子的关系。结果表明：马尾松叶片光合速率与光强和气温多元相关呈极显著水平，其回归

期刊

呼吸速率叶片光合亚热带地区光合速率合量估算模型数学模型估算结果森林生态系统回归方程

第十一课进攻手法(一)

第一节简单与复合进攻本讲已进入实战技术,在截拳道中,几乎没有任何直接的进攻。实际上,所有的进攻动作都是间接性的,或是在假动作之后发生,或以反攻方式进行的。一次完

期刊

截拳道日常训练发起进攻进攻速度前手格挡距离感进攻者技术训练拳时

论高职院校专业交叉与融合的哲学基础

专业分化是指一门相对独立而又统一的专业发展成为两门或两门以上新的分支专业。专业交叉与融合是指两门或两门以上的独立专业,通过相互影响、相互渗透而形成一门新兴的专业

期刊

专业交叉专业融合实践论本体论哲学基础整体论新兴一门当代科学马克思主义

第四届《中国京剧》票友节花絮

票友节花絮签名照相真吵“逼”走看戏袁老10月19日上午开幕式后，著名京剧表演艺术家袁世海老先生在有关人员陪同下，落座观摩席上欣赏专业演员和票友们的联袂演出。谁知，可忙坏了

期刊

中国京剧京剧表演艺术张火丁袁世海专业演员袁慧琴江其虎京剧演员耿其昌淮河营

国务院常务会议部署今年深化经济体制改革重点工作

4月20日,国务院总理温家宝主持召开国务院常务会议,研究部署2011年深化经济体制改革重点工作。会议指出,今年是“十二五”开局之年,要以更大的决心和勇气推进重点领域和关键

期刊

经济体制改革常务会议养老保险试点体制机制障碍新农保经济发展方式顶层设计行政问责制度公务接待农村改革

枣球蜡蚧在新疆的分布、寄主及危害特点

该文记叙了国内森林植物检疫对象枣球蜡蚧Ｅｕｌｅｃａｎｉｕｍｇｉｇａｎｔｅａ（Ｓｈｉｎｊｉ）在新疆维吾尔自治区的传入历史、分布、寄主和危害特点等。 This article describes the history, distribution, host and damage

期刊

枣球蜡蚧寄主植物新疆杨植物检疫对象有虫株率枣苗受害面积大球蚧圆冠榆垂枝榆

电话信道下应用DMFCC进行说话人识别

其他学术论文