HMM语音合成中基频清浊音优化算法研究

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:zhuzhihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种用于HMM参数化语音合成的针对清浊音优化的基频建模和预测方法。在参数化合成方法中,清浊音预测直接决定激励源的选择,对合成质量有关键影响。针对这一问题,该方法从基频参数提取和预测两个方面同时入手,使用语料标注信息参与基频提取,建立音节清浊音转换时刻的高斯混合模型预测基频,改善清浊音判决质量。合成语音的听测实验表明,该方法与原系统相比,合成音质和韵律都有较大改善,MOS评分由3.0升至3.5。
其他文献
针对模糊系统和神经网络各自的不足,构建了基于模糊RBF神经网络的语音识别系统,提出了一种结构等价型模糊RBF神经网络和学习算法,采用五层神经网络结构来实现模糊系统的模糊化和
会议
回声核构造是回声隐藏算法中关键因素,直接影响到嵌入的不可察觉性、检测正确率、鲁棒性、提取嵌入信息的安全性以及执行效率。首先对回声隐藏技术的最初设想、心理声学原理及
会议
本文提出了一种新的基于经验模态分解和短时分析的说话人研究方法。在特征提取上,利用希尔伯特-黄变换中的经验模态分解法获得语音信号的固有模态函数,再结合短时分析技术获得
本文中,对富士通嵌入式中文语音合成系统的设计与实现进行了描述。该系统是一个以音节为基本合成单元,在预测韵律参数的指导下,从音库中搜寻全局最优的合成单元,然后采用PSOLA算
汉语语调参数是汉语音节的重要特征,中心削波法是提取语音基音并进一步进行汉语语调识别的有效方法。由于实用中一般人语音的音调特征差别很大,致使目前各方法对汉语语调的识别
会议
本文以藏语安多方言中极具代表性的夏河话为研究对象,利用Real-Time EGG分析软件提取了元音/a/,/e/,/e/,/o/的嗓音参数基频,开商和速度商,并分元音单独出现、带前置辅音、带辅音
本文利用计算语言学的统计方法对仓央嘉措的124首情歌进行了节律方面的研究。建立了藏汉对照语诗歌节奏类型库,得出了8种主要的诗句词汇组合类型,并对每一种类型在诗歌中出现的
本文阐释玛曲元音央化现象,央化包括高元音[i]、[u]向低央元音[e]的演化,低元音[e]与拉萨话及标杆元音[a]相比来说,是一种央化现象,其开口度较低,舌位靠后。文章主要采用共振峰模
在计算机辅助语言学习系统中,不同音素间的声学混淆现象严重影响发音质量评估的准确性。特别是对少数民族地区学习者来说,地方口音更会加剧这种声学混淆的严重性。为解决这一难
会议
文章主要探讨一种操作性较强的、面向CTTS应用的语句韵律词及韵律短语预测系统,这一系统预测韵律结构只依赖语句的词类音节数序列等简单的文本信息。文章区分了现代汉语中韵律