基于稀疏卷积非负矩阵分解的语音转换方法研究

来源 :军事通信技术 | 被引量 : 0次 | 上传用户：qinyongj

【摘要】

：

为了在语音转换过程中充分提取语音的个人特征信息,同时考虑到语音的稀疏性,文章提出了一种基于稀疏卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可以承载

【作者】

：

马振张雄伟杨吉斌徐玉龙

【机构】

：

解放军理工大学通信工程学院研究生3队,解放军理工大学指挥信息系统学院,

【出处】

：

军事通信技术

【发表日期】

：

2013年02期

【关键词】

：

非负矩阵分解说话人个人特征过完备时频基稀疏性高斯混合模型训练数据转换效果帧间相似度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了在语音转换过程中充分提取语音的个人特征信息,同时考虑到语音的稀疏性,文章提出了一种基于稀疏卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可以承载语音信号中的个人特征信息及语音帧之间的相关性,而稀疏卷积非负矩阵分解得到的过完备时频基更能体现语音的细节,可以较好地保存语音中的个人特征信息。利用这一特点,通过稀疏卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的过完备时频基,然后通过时频基的替换实现语音转换。相对于传统方法,该方法能够更好地保存语音个人特征信息和语音帧间相关性,从而可以进一步提高转换语音的质量和相似度。实验仿真及主、客观评价结果表明,与基于高斯混合模型、卷积非负矩阵分解的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。 In order to fully extract the personal characteristic information of speech during the process of speech conversion, taking into account the sparseness of speech, a speech conversion method based on sparse convolution nonnegative matrix factorization is proposed. The time-frequency basis obtained by convolution nonnegative matrix factorization can carry the personal characteristic information and the correlation between speech frames in speech signal, and the overcomplete time-frequency basis obtained by sparse convolution nonnegative matrix factorization can better reflect the details of speech , You can better preserve the personal characteristics of the voice information. Using this feature, sparse convolution nonnegative matrix factorization is used to extract the overcomplete time-frequency base that matches the source speaker and the target speaker from the training data, and then the speech conversion is achieved through the replacement of time-frequency basis. Compared with the traditional method, this method can better preserve the personal characteristics of speech and the correlation between speech frames, so as to further improve the quality and similarity of converted speech. The experimental simulation and the results of both objective and objective evaluation show that the proposed method has better quality of transformed speech and similarity of transform compared with speech transform based on Gaussian mixture model and convolution nonnegative matrix factorization.

其他文献

利用社会环境资源的智元生成能提高政治学业成绩的实验报告——2017年至2018学年度政治智元生成的阶段性研究报告

一、实验原理rn智元是知识、能力和志趣的合金.若干相关智元联接起来便可生成智能组织.智能组织突变可实现学习主体智能最大化发展.智能组织突变是指学习主体不断与外界进行

期刊

标准压力传感器

英国得克福洛(Tekflo)公司研制了TF4系列低价格的标准压力传感器,用来精确测量液体、气体和水蒸汽的标准压力。传感器的测量范围从0～0.7巴到0～1000巴(约为1.02公斤/厘米~2),输

期刊

压力传感器测量元件输出电压传感器克福测量范围蒸汽液体误差电桥

对35kV 变电站综合自动化系统的结构及调试要点探讨

随着科学快速发展35kV变电站综合自动化系统目前已得到广泛应用,要求验收运行人员必须掌握相应的验收调试技术和运行经验.对35kV变电站综合自动化系统的结构和功能,现场调试

期刊

35kV变电站综合自动化调试管理

直流电动机可控硅控制方案评述

一引言近年来,可控硅控制的直流传动已经代替了惯用的 Ward-Leonard 电动机发电机组。固体直流传动有许多突出的优点,如维修简单、体积较小、重量较轻、效率较高、时间响应

期刊

可控硅控制直流电动机直流传动交流电源功率因数电机电流时间响应可控硅峰值电流电源电流

社区老年人服务研究

社区老年人发展及居家养老一直以来都是人们广泛关注的问题,本文以西安市长安区某社区为例,采取行动研究的方法来探究社区老年人的需求及发展现状.

期刊

社区老年人服务需求

新环境下如何做好图书馆推广工作

在现代化的社会发展中,互联网发展十分迅速,在这样的社会背景下数据、信息已经成为了影响人们日常生活的主要内容.随着人们生活水平的逐步提升,图书馆成为了人们积累知识、学

期刊

新环境图书馆推广工作阅读推广

基于“益红包”——助力红包暖心公益的研究

“益红包”项目是利用互联网,将红包与公益活动创新性的结合在一起,打造全民自己的公益活动.本文首先讲了研究背景,项目简介以及实施的意义;其次阐明了设计思路、创新点以及

期刊

网络红包公益活动

数字图象编码技术(下)

变换编码变换编码的方框图如图12。其中[G]为象素矩阵,[U]~T为正交矩阵[U]的转置矩阵。正交矩阵在酉变换中称为酉算子。[A]为象素矩阵[G]的酉变换域(unitary transform dom

期刊

酉变换变换编码正交矩阵象素数字图象编码技术转置矩阵预测器编码酉算子

旋转活塞发动机缸壁及转子型线加工的几何及力学原理

关于三角旋转活塞式发动机,文中作了几何量的一些计算。本文根据我们1970年在石家庄汽车配件厂的实践,叙述缸壁及转子加工的几何及力学原理,供从事研制的同志和数学系同学参

期刊

缸壁型线转子旋转活塞发动机啮合齿轮汽车配件几何量加工方法小齿轮线矢量

简易放射线测量电路的设计

物质结构的分析,环境放射能显的测定以及人体中肿瘤位置的确定等等,都包括在放射线测量的广阔范围里。市售的测量装置中,根据不同的测量用途采用了特殊的电路,也有一些与计

期刊

计数法放射能物质结构测量电路光电倍增管肿瘤位置墓本原理检测器子群计数器

基于稀疏卷积非负矩阵分解的语音转换方法研究

其他学术论文