【摘 要】
:
近年来,基于深度学习的虚假信息伪造技术(Deepfake)迅速兴起且引发了社会各界的广泛关注。语音承载着人类语言信息,语音伪造是Deepfake实现舆论操控的核心技术之一,因此针对深度伪造语音检测技术的研究已经逐渐成为信息安全的一个重要的研究领域。现有伪造语音手段种类多样且发展迅速,给伪造检测技术带来巨大挑战,因此本文针对多种不同合成语音和声音转换伪造语音方法,从时域信号和频域特征等多个角度出发,
论文部分内容阅读
近年来,基于深度学习的虚假信息伪造技术(Deepfake)迅速兴起且引发了社会各界的广泛关注。语音承载着人类语言信息,语音伪造是Deepfake实现舆论操控的核心技术之一,因此针对深度伪造语音检测技术的研究已经逐渐成为信息安全的一个重要的研究领域。现有伪造语音手段种类多样且发展迅速,给伪造检测技术带来巨大挑战,因此本文针对多种不同合成语音和声音转换伪造语音方法,从时域信号和频域特征等多个角度出发,基于时序卷积网络和深度可分离式卷积网络,实现通用的伪造语音检测框架。本文的主要研究内容及创新点如下:1)针对频谱特征在实践中涉及多种超参的调整且构造的神经网络可理解性较差等问题,考虑从时域波形出发,针对神经网络第一层引用启发式带通滤波Sinc卷积提取帧级多频带特征,利用SE模块对不同频带进行自适应重加权得到时序特征,首次引入时序卷积网络对时序特征进行分析,构造端到端通用伪造语音检测框架。实验结果表明,该模型针对测试集上多种未知伪造语音算法的语音样本检测等错误率能低至7.23%;针对声音转换等较难被检测的伪造语音算法,该模型的检测等错误率也能低至9.79%,相比较于基于时域信号的其它对比检测算法,具有显著的性能提升。2)针对现有伪造语音算法框架中的声纹特征存在相位失真的现象,本文提出基于相位功率谱特征的时序卷积网络通用伪造语音检测框架。根据一维时序卷积网络只能对帧间同频带能量和相位的相关性进行分析的事实,本文对相位功率谱特征进行频带划分,利用二维时序卷积对相位功率谱特征同时进行帧内帧间频带能量和相位相关性分析,来提取通用的伪造语音检测特征。实验结果表明,该模型在验证集上对于已知伪造算法生成的语音样本检测等错误率较低,同时对于测试集上未知伪造算法生成的样本检测等错误率比已有的基于频谱特征深度学习模型有所下降。3)针对现有基于深度神经网络的伪造语音检测模型复杂度较高的问题,本文提出基于原始复数频谱特征和深度可分离式卷积网络的轻型伪造语音检测框架。通过对原始频谱特征的复数矩阵进行实虚部分解,采用复数卷积对特征进行预处理以提取包含更丰富时频相位信息的特征,基于深度可分离式卷积网络进行伪造语音检测特征提取和分类。实验结果表明,相比较于现有的其它基于深度神经网络的伪造语音检测框架,该模型待训练参数较少且检测错误率基本持平。本文基于深度学习特征表征实现了3种通用的伪造语音检测框架,所用特征包括基于时域波形模拟时频变换特征,相位功率谱特征和复数原始频谱特征。该研究成果表明,包含丰富频谱信息的低层次特征配合精心构造的深度神经网络可以有效地提升伪造语音检测算法在未知说话人和未知伪造语音算法的泛化能力。本文研究成果可以为防止互联网络上伪造信息泛滥提供技术支持。
其他文献
纵观我国法制史,不难发现,“孝”历来都极受重视。在这种文化背景下,我国现行立法对赡养义务绝对性的规定自然就不难理解了。然而,随着越来越多父母无正当理由不抚养子女,甚至父母对子女实施虐待、遗弃、故意杀害、强奸等不法侵害行为的案件通过媒体或自媒体平台曝光出来,社会公众和部分学者在思考此现象原因时也开始质疑现行立法中赡养义务绝对性的合理性,认为赡养义务绝对性是造成此种现象频发的原因之一。除此之外,司法实
价格从哪里来是市场社会学的重要议题。采用社会建构的分析进路,既有研究强调行动者与正式或非正式社会制度的互动影响价格形成过程。依循该学理脉络,本研究将关系运作引入对价格形成的分析,阐述关系与价格之间的互动过程,解释关系运作在推动合意价格形成中的作用机制。以佛山市全屋定制市场为案例,本研究将价格置于特定的关系与文化背景,试图在理论和经验层面揭示价格形成的黑箱,分析工厂、中间人与消费者之间的关系运作过程
绿色建筑作为可持续发展背景下的一种新型建筑形式,在国外已有非常丰富的实践经验和理论成果。近年来,国内学者对于绿色建筑的发展也逐渐重视起来,但由于绿色建筑前期成本较高、回收周期较长等特征,房地产开发商开发绿色建筑出现了自主开发意愿低、融资难等问题,因此迫切需要一种新的融资方式来解决当下难题。绿色金融作为探索环境保护与治理的新型金融融资方式,是促进我国绿色建筑事业发展的主要推动力。但鉴于我国当前绿色建
目的:本研究拟通过文献内容分析、患者及医护人员质性访谈、专家小组讨论及德尔菲专家函询的方式构建一套低风险肺结节患者信息支持方案,并对其在该人群中应用的初步效果进行评估,以期为临床开展信息支持工作提供借鉴。方法:1.低风险肺结节患者信息支持方案构建(1)系统检索肺结节信息支持相关文献,使用内容分析法对纳入的22篇文献进行分析以提取肺结节信息支持相关内容。(2)采用目的抽样法抽取16名低风险肺结节患者
国际海底区域资源开发的全球治理机制的形成有两个关键的时间节点,一是1982年《联合国海洋法公约》的出台,二是1994年国际海底管理局的成立。这是一段充满了国家间相互博弈与妥协的历史:早期帕多提出国家管辖范围外的海床和洋底是“人类共同继承财产”,这颠覆了以往公地“先到先得”的传统模式,该原则得到发展中国家的积极支持并因其投票优势而得到落实。为建立国际海底区域的统一管理机制,各国一致同意建立起一个国际
大正10年(1921年),芥川龙之介作为大阪每日新闻的特派员赴中国考察旅行,同年12月执笔短篇小说《将军》,次年1月在杂志《改造》上发表。小说以明治37-38年(1904-1905年)的日俄战争为背景,由四个小故事构成。其中,故事一“白襷队”、故事二“间谍”、和故事三“阵地上的演出”以日俄战争的战场旅顺为舞台,讲述了N将军的言行及其部下的反应,而故事四“父与子”则是讲述日俄战争过后,大正时期一对父
<正>闻一多的《诗经》研究既从诗歌起源角度发现《诗经》是从歌到诗、歌与诗合流的产物而具有歌的节奏美和诗的从记事到抒情的特性,又在研究《诗经》的性欲观时发现了明言、隐喻、暗示、联想、象征等艺术表现方式。随着他《诗经》研究的深入,论定了《诗经》在内容上多为情歌、形式上多为民歌后,进一步发现了《诗经》在情爱表现方面的一种艺术方法和语言修辞,那就是隐语的运用。
抗战时期,国民政府希冀以独立的师范教育体系,在教育领域加强中央集权。由此,国民政府于1938年重新恢复高等师范教育,并赋予其教育“基石”的地位。同时,为解决女子教育存在的问题,国民政府单独设立一所冠以国家之名的女子师范学院——“国立女子师范学院”,以重建女子教育系统。在国立女子师范学院诞生之初,官方、社会、校方对国立女子师范学院的女学生抱以“国民之母”、“建国干部”与“妇女领袖”的期待。“国民之母
在现代风险社会的背景下,社会分工越来越精细,不断产生更多新兴职业,因新兴职业发展而伴随而来的犯罪行为数量和种类也在日益上升。因此,为了维护社会正常秩序和应对法律制定的相对滞后性,预防性犯罪立法应运而生,近年来我国在预防性犯罪立法有了一些突破。刑法修正案(九)在刑法第37条定罪免罚的条款之后增设第37之一:“因利用职业便利实施犯罪,或者实施违背职业要求的特定义务的犯罪被判处刑罚的,人民法院可以根据犯
全球导航卫星系统(Global Navigation Satellite System,GNSS)信号在发生反射时,受反射面物理特性的影响,其极化特性、波形、相位等会发生变化;利用GNSS反射信号,可以进行目标成像、目标探测及目标特征提取等研究。基于GNSS反射信号的双基地合成孔径雷达系统的成像分辨率受限于GNSS的信号带宽,而北斗导航系统(Bei Dou Navigation Satellite