【摘 要】
:
传统的基于隐马尔可夫模型(HMM)的语音合成系统(HTS)存在两个问题,分别是时域的过平滑问题和频域的过平滑问题。为了解决这两个问题,本文提出了一种同时利用连续隐马尔可夫模
【机 构】
:
中科院自动化所模式识别国家重点实验室,北京 100080
论文部分内容阅读
传统的基于隐马尔可夫模型(HMM)的语音合成系统(HTS)存在两个问题,分别是时域的过平滑问题和频域的过平滑问题。为了解决这两个问题,本文提出了一种同时利用连续隐马尔可夫模型和离散隐马尔可夫模型的合成系统框架。传统的HTS合成系统使用高斯函数的均值表征频谱包络,这不可避免地带来了频域过平滑问题,而本文所提出系统通过使用来自于真实频谱的离散码本矢量表征频谱包络,有效地克服了频域上的过平滑问题;传统HTS系统利用动态参数生成完整频谱,导致生成的频谱在时域上缺少变化,而本文则提出一个精心设计的码本矢量选取算法来生成完整频谱,以此克服时域过平滑问题。实验证明,通过混合使用连续HMM和离散HMM,合成语音的清晰度可以得到极大提高。
其他文献
本文在研究北京工业大学语音与音频信号处理实验室与华为技术有限公司联合提交的宽带嵌入式变速率语音编解码算法的基础上,将原结构中TCX(Transform Coded Excitation)编码输
Coordinated Multi-Point (CoMP) transmission is a technology targeted for Long Term Evolution Advanced (LTE-A).It is designed to reduce cell-edge interference,im
阐述了多媒体通信实验教学对提高学生对多媒体通信系统的实际认识,加强学生的实际动手能力和创新意识的重要意义,总结了多媒体通信实验教学平台建设、实验内容开发和实验方式
本文介绍0ne-Pass DTW算法,并利用它实现说话人识别。此算法的主要特点是采用模板组,即用多个模板作一个字的模板库。实验表明,0ne-Pass DTW比单模板的DTW更能适应说话者话音
波形内插(Waveform Interpolation, WI)语音编码模型以其在窄带编码中的优越性能引起人们的广泛重视。本文基于特征波形的非负矩阵分解(Non-negative Matrix Factorization,
宽带语音(50-7000Hz)为语音实时通信提供了更高的话音质量。本文设计了一种可以在大多数现有的窄带语音编码算法中嵌入使用的宽带语音编码算法,采用分带方法,算法用较低的码
关键词识别是近年来语音识别中颇受重视的研究领域,可广泛应用于电话的自动接听和对话监听等方面。它的一个重点技术就是关键词模型和废料模型的建模方法,本文主要研究的就是
在一个炎热的夏日,英俊的王子带着仆人在野山丛林中打猎。下午王子主仆俩满载猎物而归。由于夏日午后的酷暑和大量的运动,使得王子主仆大汗淋漓舌焦口燥,可是水袋已空空如也
以木薯SC5为研究对象,通过对干旱胁迫条件下,植株内源脱落酸(ABA)/脯氨酸/过氧化物酶(POD)等干旱相关指标的测定及气孔形态的观察,对木薯SC5抗旱性进行描述.结果表明:木薯心
岩石爆破理论模型随着爆破技术和相邻学科的发展也取得了很大的进展,本文对这些理论模型进行了归纳,主要有三方面:弹性理论模型、断裂理论模型、损伤理论模型。