基于MIDI的汉语普通话语音合成算法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:birentx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成是人机语音交互的一个重要组成部分.语音合成研究的目的是制造一种会说话的机器,使一些以其它方式表示和存储的信息能转化为语音,让人们能通过听觉而方便地获得这些信息.语音合成的基本方法,可以归纳为三大类:波形合成方式、参数合成方式和规则合成方式.数字乐器接口(MIDI)设备是目前一切PC和音频设备的标准配置,利用它来做语音合成可以最大限度地节省系统成本和减少运算量.该文提出了基于MIDI的语音合成算法.该算法属于波形合成方式,通过对标准的可下载声音(DLS)波表的语音扩展,以实现象合成乐音一样地合成语音.在实现上述算法过程中,该文完成了以下工作:1、在分析了汉语普通话语音学特征的基础上提出了利用语谱图和短时过零分析从音节中切分普通话声母和韵母的方法.2、将所有的声母和韵母波形制作成符合DLS结构的语音波表,并通过保留韵头段和对韵腹段波形的重复达到压缩存储空间的效果.3、利用ADSR修正结构对阴平波形的频率进行修正以得到其它的三个声调,这样使得每一个韵母只需要存储一套波形数据和四套ADSR结合参数就可以合成出所有声调.4、将所有的语气、韵律和节奏控制信息统一用MIDI消息实现,以合成不同语境下的语音.该算法把音乐合成与语音合成统一到一个标准工业规范下面,这使得算法的可移植性和可扩展性得到了充分的保证,同时也为音频信号的统一处理提供了保证.
其他文献
诱导多能干细胞即iPS细胞是通过向体细胞中以病毒方式导入外源的四个转录因子Oct3/4,Sox2,c-Myc及Klf4而获得的,具有与胚胎干细胞(ESC)相似的形态、表观遗传特征和分化的全能
学位
该文着重讨论了微处理器中占整体功耗比重最大的模块之一—片上高速缓冲存储器(Cache)-的低功耗设计方法.首先介绍了所设计的8KB四路组相联Cache的整体电路结构和读写时序.在
十年育树,百年树人。生物教师既教书上,又要育人。作为既是班主任,又是生物学科教学的老师,德育肯定是首要,环保意识的培养更是培养出优秀学生必要条件。环保这一词看似高大上,但对
偏振模色散的测量与补偿是下一代高速大容量光纤通信系统要解决的关键技术之一,我们取得的主要成果和主要创新点如下1、系统地总结了一阶偏振模包散的产生机制、能量耦合模型
随着经济的发展、城镇化进程的加快,城市生活污水处理厂的大量兴建将势在必行,而污泥是污水处理的必然附属产物,它含有丰富的氮、磷、钾和有机质等营养物质,是一种公认的有用
帕金森氏病(Parkinson’s disease)是影响中枢神经系统的第二大神经退行性疾病,它的发生会损害病人的运动技能、语言能力等方面的功能。帕金森氏病的主要特征为大脑黑质区域
根据摩尔定律,单片集成电路上可以集成的晶体管数目大约是每三年增加四倍.随着集成电路工艺技术的突飞猛进,集成电路的设计能力和集成电路工艺的制造能力之间的差距越来越大.
随着互联网的发展,大数据、云计算等的出现,我们已经来到一个信息爆炸的时代。据统计全球每年的数据存储量已经达到惊人的1021byte数量级,而且这一信息存储量每三年将增加一
随着半导体技术和集成电路技术的发展,便携式电子产品也得到了飞速的发展,在给人们的学习和生活带来便利的同时,人们对便携式电子设备的要求也越来越高,推动着便携式电子设备
本文详细阐述了SiGe异质结晶体管(SiGe HBT)的基本原理、材料特性、异质结器件的设计、制造工艺和参数的测试,并对以SiGe材料为基础的低噪声放大器(LNA)制造技术进行了广泛而