【摘 要】
:
说话人转换技术涉及了语音分析、语音编码、语音合成、语音识别、语音切分等语音信号处理的领域,是语音信号处理的一个新分支.作为与摩托罗拉公司合作的跨语种说话人转换项目
论文部分内容阅读
说话人转换技术涉及了语音分析、语音编码、语音合成、语音识别、语音切分等语音信号处理的领域,是语音信号处理的一个新分支.作为与摩托罗拉公司合作的跨语种说话人转换项目的前期阶段工作,该文研究了一种基于隐马尔可夫模型(HMM)的说话人转换算法.该文中讨论了说话人语音特性的参数表征方法,并列出英汉两种语言在语音特点上的差异,分析了跨语种说话人转换所面对的主要问题,由此引出该文在语音合成引擎以及转换算法选择上的出发点.隐马尔可夫模型是对语音参数进行建模的常用工具,早就被用于语音识别技术上.隐马尔可夫模型下表征说话人特征的语音参数具有较为容易修改的形式.采用HMM参数模型,在HMM聚类技术和内插以及平滑算法的帮助下,可以克服说话人转换过程中训练数据不足的主要问题,而高维度隐马尔可夫模型细化了说话人的特征,它的使用突破了隐马尔可夫模型一般只用于语音识别的限制,并且在一定程度上克服了参数方法合成语音质量低的缺点.因此我们选择了隐马尔可夫模型来实现说话人转换中的语音参数建模.该文在总结了说话人转换现有技术的基础上提出通过对语音进行基频、梅尔倒谱系数等参数的高维度隐马尔可夫建模,然后通过对模型参数修改来达到转换目的的新算法.在一定程度上实现了在目标说话人语音小训练样本条件下的同语种说话人转换,为跨语种说话人转换的研究打下了基础.在这种算法的实施过程中,我们构建了一个质量较高的基于HMM的语音合成引擎,并最终成功的改变了说话人语音的一些特征参数,为实现自然度较高的双语语音合成平台准备了条件和积累了经验.最后,通过对实验结果的分析,该文总结了这一阶段工作的不足,为将来继续在这一方面的深入研究提出了一些值得研究的课题和可以借鉴的经验.
其他文献
作为人与人之间最为自然的交流方式,语音操作方式显然也是人机交互时的最佳选择之一。今天,无处不在的嵌入式系统不断地改变着我们的生活。由于很多嵌入式系统,尤其是近年来发展
丹江口水库是我国南水北调中线工程的水源地,维护其库区湿地生态系统的健康对调水工程具有非常重要的意义。湿地植被是湿地生态系统的主要初级生产者,也是湿地其它生物生长和新
湖泊水体富营养化引发的大面积蓝藻水华已成为世界范围内的重大环境问题,一些蓝藻水华产生的有害的次级代谢产物如蓝藻毒素,对淡水生态系统和人类健康造成了严重的威胁。鱼腥藻
由于焚风效应和封闭地形导致的大气局部环流,我国西南干热河谷地区具有高温、强光和干旱的气候特征,发育形成典型的稀树灌丛植被,蕴藏着抗逆性强的植物类群。然而,目前尚缺乏对干
1 蔬菜产地价、批发价略跌,零售价平稳rn1.1 蔬菜产地价多数波动,总体略跌rn第8周(2020-02-17-2020-02-23)重庆市20个主要地产蔬菜监测品种均价4.21元(千克价,以下无特别说明
纳米硅器件是当前微电子学和纳米电子学研究的热点,并被证明在硅基光电集成的运用上具有良好的前景。纳米硅器件的研究和应用的关键在于如何以和硅平面工艺兼容的方法制备出高
短波OFDM (Orthogonal Frequency Division Multiplexing)系统能够抵抗频率选择性衰落,提升频谱利用率。而信道估计对于短波OFDM系统具有重大意义,它是系统进行均衡与解调的
光学参量振荡器(OPO)可以产生宽范围可调谐激光输出,它的出现不仅拓宽了激光输出波长,而且能实现宽范围的快速变频输出.随着非线性材料技术和激光技术的发展,人们对OPO的研究
随着深亚微米工艺技术的迅速发展,集成电路设计已经进入片上系统(SoC)时代,各种32位、64位的CPU也已经问世.与大多数高科技的发展进步不同,高性能处理器技术的进步并未导致已
本文针对农村经济发展中民间金融的相关问题进行了分析。文章阐述了农村民间金融发展需要考虑的因素,分析了农村民间金融存在的问题,最后提出了农村民间金融的改革措施,旨在