嵌入式中英文双语语音合成系统

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:asdfasdf32111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术的发展,越来越多的实际产品中采用了较传统方式而言更为友好的人机交互形式。而语音合成技术,作为人机交互技术中的关键技术之一,已经被广泛的应用到许多嵌入式设备之中。在实际应用中,经常有多种语言同时出现在一句话当中的情况。最典型的是,中文和英文经常同时出现在日常用语中。因此处理多语言是语音合成技术通向实用必须要解决的问题。   本文的研究工作如下:   提出了一种基于决策树聚类的音库裁减策略,它以样本的韵律特征相似性为客观依据,同时考虑到每个样本所处上下文环境的相似性,对每一个音节的样本进行聚类。可以根据用户指定的压缩率,在每一类中挑选离类中心最近的若干样本,完成对音库的裁减。   参与实现了基于韵律模板的韵律预测模型。采用决策树的方法对音节的韵律特征进行建模,包括时长、能量、静音、基频均值、基频最大值、基频最小值、基频起始值、起始处的斜率、基频终止值、终止处的斜率等;在进行预测时,除了考虑传统的上下文信息之外,还利用候选单元的韵律特征预测其前后音节的韵律环境,并以此作为拼接代价和目标代价的计算依据,使用VITERBI搜索的方法从韵律库中得到最优的韵律模板序列,完成韵律参数的预测。   调查了英文基本声学单元的韵律特征的分布情况,论证了采用中文语音合成系统中成熟的韵律预测方法对英文进行韵律预测的可能性,并且考虑了英文基本声学单元与中文基本声学单元之间的不同之处,在保持大框架不变的前提下,对模型细节部分做了一定的修改。   实现了一个嵌入式中英文双语语音合成系统的原型。在实现过程中,主要关注了中文合成系统与英文合成系统的融合。讨论了由于嵌入式平台硬件的局限性带来的问题,并提出了相应的解决方案。
其他文献
随着互联网技术的快速发展,多媒体信息的发布形式也越来越多,其中计算机网络是传播信息的一个重要媒介,它使得图像数据的传输变得简单且快捷。数字媒体技术的发展使得图像、视频
交通问题一直是人类文明的一个重要方面。但是伴随着经济的高速增长,城市的交通需求也快速增长,越来越多的车辆行驶在城市路网上,并带来了一系列的问题,如交通拥挤、交通延误、环
在实际工业生产过程中,随机性是普遍存在的。系统中随机性的引入,更为准确地描述了模型和实际对象之间的不一致性,更为真实地反映了系统参数变动和干扰的存在性。因此,研究线
随着我国农业种植水平的提高以及国内人民对水果的消费量不断增加,我国的桃子、苹果、梨子以及柑橘等主要种植水果的产量以及种植面积均达到世界第一,农业水果采摘的自动化能够
视频新闻节目具有及时、准确、生动、信息量大的特点,每天传播着大量的时事消息,是最受人们欢迎的新闻传播方式之一。因此,有电视节目运营公司专门提供视频新闻的点播服务。点播
导弹的精确制导在现代国防中占有越来越重要的地位。导弹与目标间相对运动的运动学和动力学模型是一个非常复杂的非线性系统,传统制导中常用的线性方法将不再适用。因此采用新
以太网以其成本低廉、开放性和兼容性好等优点,目前已成为使用最为广泛的网络通信技术,是商业领域中网络通信市场的主要占有者。随着其速率的不断提高和全双工交换技术的运用
睡眠是一项非常重要的生命过程,是人体重要的生理活动,它与人的健康、学习、生活、工作等之间的关系甚为密切,但至今人类对其了解还很少。失眠是一种最为常见的睡眠障碍性疾
基于结构光系统的物体三维轮廓测量技术,由于具有测量速度快、非接触式等好的特性,因而在科学和商业领域得到了广泛的应用。一个基本的结构光系统包括一个相机和一个光栅条纹投
近红外光谱(简称NIRS)作为一种现场、快速、无损、无污染的绿色分析技术,近年来,被广泛应用于石油化工、食品药品、制药等行业。随着精密分析仪器的广泛使用,产生的高维、海量NIRS