基于稀疏卷积非负矩阵分解的语音转换方法研究

来源 :军事通信技术 | 被引量 : 0次 | 上传用户:qinyongj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了在语音转换过程中充分提取语音的个人特征信息,同时考虑到语音的稀疏性,文章提出了一种基于稀疏卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可以承载语音信号中的个人特征信息及语音帧之间的相关性,而稀疏卷积非负矩阵分解得到的过完备时频基更能体现语音的细节,可以较好地保存语音中的个人特征信息。利用这一特点,通过稀疏卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的过完备时频基,然后通过时频基的替换实现语音转换。相对于传统方法,该方法能够更好地保存语音个人特征信息和语音帧间相关性,从而可以进一步提高转换语音的质量和相似度。实验仿真及主、客观评价结果表明,与基于高斯混合模型、卷积非负矩阵分解的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。 In order to fully extract the personal characteristic information of speech during the process of speech conversion, taking into account the sparseness of speech, a speech conversion method based on sparse convolution nonnegative matrix factorization is proposed. The time-frequency basis obtained by convolution nonnegative matrix factorization can carry the personal characteristic information and the correlation between speech frames in speech signal, and the overcomplete time-frequency basis obtained by sparse convolution nonnegative matrix factorization can better reflect the details of speech , You can better preserve the personal characteristics of the voice information. Using this feature, sparse convolution nonnegative matrix factorization is used to extract the overcomplete time-frequency base that matches the source speaker and the target speaker from the training data, and then the speech conversion is achieved through the replacement of time-frequency basis. Compared with the traditional method, this method can better preserve the personal characteristics of speech and the correlation between speech frames, so as to further improve the quality and similarity of converted speech. The experimental simulation and the results of both objective and objective evaluation show that the proposed method has better quality of transformed speech and similarity of transform compared with speech transform based on Gaussian mixture model and convolution nonnegative matrix factorization.
其他文献
一、实验原理rn智元是知识、能力和志趣的合金.若干相关智元联接起来便可生成智能组织.智能组织突变可实现学习主体智能最大化发展.智能组织突变是指学习主体不断与外界进行
期刊
英国得克福洛(Tekflo)公司研制了TF4系列低价格的标准压力传感器,用来精确测量液体、气体和水蒸汽的标准压力。传感器的测量范围从0~0.7巴到0~1000巴(约为1.02公斤/厘米~2),输
随着科学快速发展35kV变电站综合自动化系统目前已得到广泛应用,要求验收运行人员必须掌握相应的验收调试技术和运行经验.对35kV变电站综合自动化系统的结构和功能,现场调试
一 引言近年来,可控硅控制的直流传动已经代替了惯用的 Ward-Leonard 电动机发电机组。固体直流传动有许多突出的优点,如维修简单、体积较小、重量较轻、效率较高、时间响应
社区老年人发展及居家养老一直以来都是人们广泛关注的问题,本文以西安市长安区某社区为例,采取行动研究的方法来探究社区老年人的需求及发展现状.
在现代化的社会发展中,互联网发展十分迅速,在这样的社会背景下数据、信息已经成为了影响人们日常生活的主要内容.随着人们生活水平的逐步提升,图书馆成为了人们积累知识、学
“益红包”项目是利用互联网,将红包与公益活动创新性的结合在一起,打造全民自己的公益活动.本文首先讲了研究背景,项目简介以及实施的意义;其次阐明了设计思路、创新点以及
变换编码 变换编码的方框图如图12。其中[G]为象素矩阵,[U]~T为正交矩阵[U]的转置矩阵。正交矩阵在酉变换中称为酉算子。[A]为象素矩阵[G]的酉变换域(unitary transform dom
关于三角旋转活塞式发动机,文中作了几何量的一些计算。本文根据我们1970年在石家庄汽车配件厂的实践,叙述缸壁及转子加工的几何及力学原理,供从事研制的同志和数学系同学参
物质结构的分析,环境放射能显的测定以及人体中肿瘤位置的确定等等,都包括在放射线测量的广阔范围里。市售的测量装置中,根据不同的测量用途采用了特殊的电路,也有一些与计