【摘 要】
:
随着信息技术的飞速发展和计算机技术的不断进步,人机交互方式发生了革命性的变化,人们在不断寻求灵活、方便、快捷的信息交换方式时,语音合成技术应运而生。语音合成(Speech Sy
论文部分内容阅读
随着信息技术的飞速发展和计算机技术的不断进步,人机交互方式发生了革命性的变化,人们在不断寻求灵活、方便、快捷的信息交换方式时,语音合成技术应运而生。语音合成(Speech Synthesis)又称文语转换(TTS,Text-To-Speech),是将计算机中存储的文本转换成对应的语音,是计算机和人类交互的一种手段。目前,汉语语音合成技术在合成单音节上已经相对成熟,但是合成连续语音流时总是不够清晰和自然,因此汉语语音合成需要在提高语音合成的自然度和可懂度方面进一步提高。
本文分析各种语音合成算法的优缺点后,将TD-PSOLA算法和正弦模型分析算法相结合用于汉语语音合成,通过平滑处理后,合成连续的语音流。用小容量的声母加韵母过渡以及四个声调的韵母制作成语音库,使得该语音合成系统的语音库很小,易于移植到其他应用平台,以便扩大其应用范围。TD-PSOLA算法具有方便灵活的韵律调整能力,但是当基音频率修改范围过大时,会出现失真和回声效应;而正弦模型分析算法能够对语音信号进行宽范围的基频调整,保证了相邻两帧语音之间幅度和相位的连续性。结合这两种算法的优点,使得语音合成具有灵活调整韵律的能力,为以后研究带情感的语音合成提供了基础。针对目前一直存在的字与字之间的拼接问题,研究了相邻音节的拼接规律,实现了字与字之间拼接的平滑过渡,在提高合成连续语流的自然度方面得到很大的提高,使机器的发声更加接近人的发声。针对很多语音合成系统中没有实现多音字处理的功能,本系统增加了多音字词库,实现了简单的多音字处理功能。
虽然在提高语音合成的自然度方面得到了很大的提高,但是仍然有许多问题存在,本文在最后针对这些问题作了总结,以便后来的研究者对本系统的不足之处进一步地完善。
其他文献
模式识别的主要任务就是利用样本的特征,将样本划分为相应的模式类别。但在实际的处理过程中经常会碰到高维数据样本。一方面,数据的特征维数越大,则数据提供的有关客观现象
随着近年来无线通讯技术的迅猛发展,随时随地通讯的理念越来越深入人心。Adhoc网络及其相应的路由协议在这样的背景下,由狭窄的纯军事应用,扩展为具有广泛应用前景的军民两用
电子政务是政府机关提高办公效率、改善服务质量、进行信息共享的一种有效手段。随着我国政府信息化建设的发展,各政府部门开发了大量信息系统。由于这些系统采用了不同的运
无线射频(RF)及电力线载波(PLC)均是物联网终端设备中重要通信技术手段,广泛地应用于工业控制、环境监测及电力抄表等领域。无线射频以电磁波为媒介进行数据传输,电力线载波
随着互联网技术和移动通信技术的不断向前发展,越来越多的人希望随时随地的访问互联网的无限资源,为自己的办公、学习、生活创造便利,因此两者的融合成为大势所趋,移动IP就是
电子病历是医院信息化建设的核心,是实现区域医疗信息共享的关键。它对提高医疗质量、医院工作效率以及医院管理水平都有非常重要的意义。电子病历信息包括患者在医疗活动中
在分析研究了几种比较典型的P2P网络安全模型的基础上,本文提出了一种应用关系集合的P2P网络信任模型RSTM(Relationship Set Trust Model)。利用人类社会中的关系集合概念,随
H.264是一种高性能的视频压缩编码标准。相比以前的视频编码标准,H.264采用了许多新技术,使得它具有低码率、高画质、高压缩比等特点,但这是以计算复杂度的增加为代价的。在
随着计算机和网络技术的飞速发展,多媒体被广泛地运用到人们社会生活中的各个领域。同时,多媒体产品的安全问题已成为目前一个十分重要而又富有挑战性的研究课题。数字水印技术
由于宽带网络的普及,网络已应用于生活中的方方面面,许多传统的工作方式也开始发生变化,变得更为科技化、现代化,与此同时基础电信企业的互联网用户进一步趋向宽带化。从当今