【摘 要】
:
语音合成是当今计算机智能应用领域的研究热点,目前它越来越广泛的应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益.但现阶段语音合成中存在的普遍问题是:
论文部分内容阅读
语音合成是当今计算机智能应用领域的研究热点,目前它越来越广泛的应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益.但现阶段语音合成中存在的普遍问题是:合成语音的自然度不够高,韵律调整能力差.该论文主要从文语转换系统中连续的两部分,即前端的韵律结构预测和后端的语音合成实现入手研究,进而改善汉语语音合成的自然度.韵律结构预测具体包括韵律短语边界界定和语句重音判别两方面.韵律短语边界界定采用了基于结构助词驱动的方法,文中通过分析虚词的特征,研究了结构助词在连续语流中的特点、地位,以及在韵律短语界定中的作用,得到一组相应的规则.系统在采用基于错误驱动方法的基础上引入这些规则给出较为适当的韵律短语分界,赋予了语句发音的节奏感,获得了比较好的效果.语句重音判别利用了神经网络对大规模语料的自动学习能力,神经网络采用BP网络,它是一种多层前馈神经网络,可以实现从输入到输出的任意的非线性映射.BP神经网络的输入是从文本中提取的音节环境特征矢量,输出值经过二值化处理即成为重音标注结果.语音合成实现采用的是时域基音同步叠加法,通过该方法实现前端预测得到的韵律结构信息的韵律特征.韵律特征的修改主要通过调整音长和基频来实现.调整音长和基频的关键是在不改变基频轮廓的情况下计算合成基音标记,然后确定合成基音标记到分析基音标记的映射关系,根据此映射关系确定合成短时信号,再利用基音叠加算法输出合成语音.
其他文献
目前,在电子政务建设过程中,经常面临信息孤岛问题。各业务系统间的互联互通、信息共享、业务协同是电子政务深入发展最迫切需要解决的问题。解决这些问题的关键在于如何在各系
流媒体是指采用流式传输的方式在Internet上播放的媒体格式。随着流媒体服务的普及,人们对流媒体服务本身的服务质量有了更高的要求。当前,影响流媒体系统服务质量的因素很多,包
近些年,由于PC优异的性能价格比,以及其上大量应用软件和开发工具的涌现,PC技术被越来越多的应用在控制器产品中,采用PC平台作为数控硬件平台已经成为一种趋势.同时随着控制
随着Internet技术的兴起,B/S结构成为当今应用软件的首选体系结构。在这种结构下,用户界面完全通过WWW浏览器实现,一部分事务逻辑在前端实现,但是主要事务逻辑在服务器端实现,主要
存储数据的飞速增长,要求企业的信息系统不仅要提供更大的存储容量:同时还要提供更高的存储速度。分级存储是当前存储系统中解决容量和速度问题的重要技术。面对海量数据的存
计算机图形绘制技术是计算机科学的重要研究领域.近十几年来,图形加速硬件特别是普通PC机上的低端图形加速卡有了飞速发展,几乎每六个月处理速度就增加一倍,生成的图像色彩更
恶意域名指传播蠕虫、病毒和特洛伊木马或是进行诈骗、色情内容传播等不法行为的网站域名。随着Fast-Flux、DGA技术越来越广泛的被黑客采用,网络攻击更加隐蔽,恶意追踪更加困难
网格计算是构筑在Internet上的一组新兴技术,利用共享网络将分散在不同地理位置的计算资源、存储资源、网络资源组织成一台虚拟的超级计算机,提供强大的计算能力。QoS(Quality
智能化刺绣CAD是伴随CAD的迅猛发展而不断发展起来的一个应用于刺绣行业进行针位数据编程的软件系统。随着计算机技术的不断进步,电脑刺绣机的性能在不断提高,功能不断完善,促进
虚拟仪器就是在通用计算机平台上,用软件实现传统测试仪器的功能.它有许多优点,代表了当今仪器发展的方向.频率分辨力是频谱仪的关键性能指标,在这个性能上,FFT或频谱仪好于