基于角度间隔嵌入特征的端到端声纹识别模型

来源 :计算机应用 | 被引量 : 0次 | 上传用户:chenchengDelphi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统身份认证矢量(i-vector)与概率线性判别分析(PLDA)结合的声纹识别模型步骤繁琐、泛化能力较弱等问题,构建了一个基于角度间隔嵌入特征的端到端模型。该模型特别设计了一个深度卷积神经网络,从语音数据的声学特征中提取深度说话人嵌入;选择基于角度改进的A-Softmax作为损失函数,在角度空间中使模型学习到的不同类别特征始终存在角度间隔并且同类特征间聚集更紧密。在公开数据集VoxCeleb2上进行的测试表明,与i-vector结合PLDA的方法相比,该模型在说话人辨认中的Top-1和Top-5上准
其他文献
为实现采煤机控制的数字化,提高采煤机控制的可靠性,解决采煤机无反转启动问题,对采煤机调速系统进行了无位置传感器控制技术的研究,建立了无位置传感器开关磁阻调速系统的硬
新媒体在外语教学中蓬勃发展,在其五大特性弥补了传统外语教学不足的同时,也带来了于师于生的诸多挑战。本文在调查高校外语学生利用新媒体学习现状的基础上,总结出教师"教"
目的检测人脂蛋白相关磷脂酶A2(Lp-PLA2)基因N133K位点多态性与不同类型冠心病之间的相关性及临床意义。方法以心绞痛患者426例为心绞痛组、心肌梗死患者415例为心梗组,以同期
本文根据常见的高压典型故障分类,总结了CT高压部分故障和常用维修方法,并就一些常见故障维修做了举例,以供CT维修的同行参考。
本文介绍了细菌分类学研究的概况和盐单胞菌属、噬嘌呤菌属及芽胞杆菌属的分类学研究进展。对采自中国内蒙和青海土样中的细菌进行了选择性分离研究,对分离得到的细菌分离株
为了考察糖尿病患者对食物血糖生成指数(GI)知识的接受性,选择了72例糖尿病病例作为研究对象,随机分为2组.试验组以不同食物的血糖生成指数为主要教育材料(GI组);对照组以北
沙坪沟钼矿床位于安徽省金寨县,大地构造位置属于大别造山带东段,是世界第二大斑岩型钼矿床。沙坪沟钼矿外围发现有银山、盖井等多处铅锌矿床,但其与斑岩型钼矿的成因联系不
目的通过比较不同蔬菜、不同烹调方法间维生素B1、维生素B2保留因子(RF)的差异,探讨影响蔬菜维生素B1、维生素B2保留因子的因素。方法选取了常见的12种蔬菜,以炒、炖、炸、蒸、
本文提出了用对比和演示的方法加深“转动惯量”概念和“角动量守恒”条件的理解,并具体介绍了“球-棒弹性碰撞演示仪”的设计思想、结构、制作和演示内容.
发酵乳是将鲜牛乳在一定温度一定时间经特定菌群发酵后生成的一类含多种有益菌群的乳制品[1]。用于发酵的特定菌群多为乳酸杆菌类、嗜热链球菌、双歧杆菌类等。发酵乳包括液态的