【摘 要】
:
说话人识别通过说话人的声音确认其身份,具有其他身份认证技术不具备的优势,而且语音采集过程简单,用户接受度高,在军事、公安司法部门和互联网等领域有着广泛的应用。说话人
论文部分内容阅读
说话人识别通过说话人的声音确认其身份,具有其他身份认证技术不具备的优势,而且语音采集过程简单,用户接受度高,在军事、公安司法部门和互联网等领域有着广泛的应用。说话人识别系统的性能易受背景环境、说话人身体状况情绪变化及信道失配等问题的影响,提高特征表示能力成为提升系统性能的关键。从特征选择与提取的角度出发,本文将常向量方法和深度学习应用到说话人识别的主流模型中;改进了GMM模型初始化算法;提出了一种GMM超向量的规整和构成方法;从特征补偿的角度出发,本文对GMM-SVM和全变量因子分析的规整和补偿技术进行研究。通过实验验证上述引入和改进的方法能够提高确认系统的分类准确率。(1)本文引入常向量方法对原始频谱特征进行空间变换,提取更加有效的语音特征。将CVA与GMM-UBM、GMM-SVM和全变量因子分析模型相结合,论证了常向量方法应用于说话人识别中的有效性。(2)本文引入深度学习对原始频谱特征进行逐层信息抽取,学习到的深度特征作为GMM-UBM和全变量因子分析模型的输入,论证了深度特征应用于说话人识别中的有效性。本文主要研究工作如下:(1)对语音的特征分析与提取进行研究。本文对语音信号的预处理、时域以及频域特征进行简单介绍。(2)基于常向量方法的说话人识别研究。本文通过理论分析和实验论证了将常向量方法应用到说话人识别中可有效提高系统的性能;改进了GMM模型初始化方法;提出了一种GMM超向量的规整和构成方法;对全变量因子分析中的规整方法和信道补偿技术进行研究。(3)基于深度学习的说话人识别研究。本文利用RBM学习深度特征并将其应用到说话人确认系统中进行研究,通过实验论证了将深度特征应用到说话人识别中可有效改善系统的性能。
其他文献
绩效评估是公务员管理中的重要环节。在我国现行公务员绩效评估体系中,存在着绩效指标效度较低,绩效评估方式陈旧、单一,评估主体的非专业化和评估过程的形式化,绩效管理功能
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
推动社会主义文化大发展大繁荣是文化工作和文化建设的主题。只有适度平衡社会主义文化大发展大繁荣中的继承与创新、高雅与通俗、普及与提高、引领与包容、开放与安全、社会
语言是文化的载体,语言教学中英语文化背景知识的缺乏将会严重影响英语学习者的跨文化交际。因此,英语教学过程应该是语言知识和文化信息同时输入的过程。而且,英语课堂教学和课
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
采用分子动力学方法模拟研究了醇胺浮选药剂十二胺、十二醇及其混合物与石英的界面作用,得到吸附稳定后的团簇形貌及水分子排布,发现十二胺可在石英表面形成稳定的柱状半胶束
多元参与,即公民、专家、新闻媒体、第三部门、企业等社会各主体参与到政府决策管理事务中去,政府敞开民众表达的大门,民众畅所欲言,多元的参与以期使政府与民众关系达至最佳状态
国内对于总控理论的研究处于开始阶段,仅有部分实践工作,通过对总控理论以及总部基地项目的分析,提出总部基地总控的总体方案存在问题的七个方面和设计要点,为总体规划设计、
《诗经》是我国第一部诗歌总集,又是上古时期用以配乐的歌词之集,是中国古典音乐的书面文献经典之作,这些歌诗是按照音乐形式组合起来的语言有机体,既适合歌咏,亦适合吟诵。
邓小平同志南方谈话开启了党第二次思想解放的浪潮。社会主义本质论强调生产力的作用,体现了共同富裕的目标,为中国社会主义事业的发展指明了前进的方向。社会主义市场经济理