多说话人识别策略研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xingyu9404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别,又称“声纹识别”,它通过从说话人的语音中抽取、对比说话人的个性特征从而识别出说话人的身份。该项技术自60年代开始发展,近年来已日趋成熟。其中单说话人识别技术,即对于识别语音中只含有一名说话人语音的识别技术,已经开始商业化并取得了可观的经济效益。在安全领域,说话人识别技术主要可应用于身份认证与安全控制;在司法领域,该技术主要应用于犯罪嫌疑人的追踪与身份确认,并可用于司法审判的技术证据;在服务业,该技术可以辅助商家辨认顾客身份,提供个性化的定制服务。目前,多说话人的识别已进入研究领域。   本文着重研究电话语音的多说话人识别方法。通过使用滑动窗技术,利用说话人模型对各语音窗打分,基于置信度准则为每个说话人模型选取来自其所代表的说话人的语音窗,并丢弃影响识别的混有两名说话人语音的窗。用说话人模型对其所选取的语音窗打分,通过综合各模型打分得出最终的识别结果。   论文研究了基于模型打分的置信度准则,提出了“最小语音长度限制”与“非首选模型打分抑制”的策略。与基线系统的对比实验表明,本文提出的方法达到了91.30%的首选正确率,比基线系统的性能提高了14.96%。   
其他文献
天蓝色链霉菌A3(2)基因组测序菌株是M145。M145不同于其它衍生菌株,其染色体上的bldA基因不能够被中断,是营养生长的必需基因,相应基因型为bad(bldA-dependent)。bldA编码天蓝色链霉
近年来,随着社会和科技的发展,风洞实验的重要性越发凸现出来,风洞实验是飞行器研制工作中的一个不可缺少的组成部分。它不仅在航空和航天工程的研究和发展中起着重要作用,在交通
扩频通信是为达到特定目的而用更宽的频率带宽来替代原信息较窄的带宽来进行通信的一种模式,这种新模式的诞生给通信领域的技术革新带来了巨大力量。跳频通信(FH)是多类扩频方
在学前教育中,一个关注度比较高的问题,就是幼小衔接.最近几年来,幼小衔接的教育问题,引起了越来越多国内外研究学者的重视.幼儿园到小学,这个过程中除了学习环境有了转变之
目的:使用PCR技术获得α-葡萄糖苷酶基因序列,通过SWISS-MODEL服务器对α-葡萄糖苷酶结构进行预测,结合氨基酸的性质特点,对酶蛋白进行分子设计,采用PCR突变试剂盒对其进行定点突
本文以工程应用为出发点,理论联系实际。在深入地分析了国内外的一卡通消费系统的发展和现有技术的优缺点,结合对当前一卡通消费系统的发展方向和前景的理解,同时对一卡通消费系
随着网络技术的迅速发展,群组通信特别是计算机视频会议、网络音/视频广播、股市行情发布、远程教育、计算机支持的协同工作(CSCW)、分布式交互仿真等大量兴起。这些实时多媒
本文首先分析了当前网络流量研究的应用领域,对多种流量研究方法和常用测量工具进行了介绍和对比,并且描述了典型网络应用程序的流量特征。其次,对流量采集的原理和实现方法进行
H.264是国际电信联盟(ITU-T)的视频编码专家组(VCEG)和国际标准化组织(ISO)/国际电工委员会(IEC)的活动图像专家组(MPEG)共同建立的联合视频组(JVT)开发的一个新的数字视频编
在现代心理学研究中,记录脑电图是研究大脑认知活动的重要手段之一。由于与大脑认知活动相关的诱发电信号淹没在很强的背景噪声中,如何从强背景噪声中提取出微弱的诱发响应信号