论文部分内容阅读
最近几年,深度学习飞速发展,人工智能迎来了新的发展高潮,尤其在图像识别、自然语言处理、语音处理等多个领域已经超越了人类。但是深度学习算法、模型和数据集等方面依然面临着许多安全威胁,比如对抗样本攻击。对抗样本攻击简单的说就是向数据集的数据中添加不易察觉的扰动,导致分类器错误分类。目前对抗样本的防御集中在分类模型的改进,效果一般,许多模型后来都逐渐被对抗样本新的攻击算法所攻破。本文避开对模型鲁棒性的改进,通过对分类器需要分类的图像进行预处理去噪,将深度学习的图像去噪应用到对抗样本攻击的防御中。本文的工作主要有以下几个方面:由于对抗样本的噪声的特殊性,本文采用深层卷积神经网络去进行图像的去噪,利用深度网络学习噪声特征,提高去噪效果;由于传统的深度学习网络随着网络层数的增加会出现图像细节丢失等问题,利用残差学习反向去学习噪声的规律,可以很好的解决深度学习的梯度弥散等问题,并利用BN层和Relu层可以提高模型训练效率;提出D-D模型,通过两种不同的对抗样本的防御模型的叠加,提高对抗样本的防御的成功率,并通过理论和实验验证该方法对对抗样本防御的有效性;使用1-SSIM损失函数解决深度残差网络去噪造成的图像模糊的问题;提出L2和1-SSIM组合损失函数进行图像去噪清晰度和图像去噪效果的均衡。通过实验:(1)训练出深度残差网络最优参数,并将结果与其他去噪模型进行对比,本文的方法具有较好的对抗样本去噪效果。(2)修改原有的基于残差学习去噪模型DnCNN的损失函数,解决原模型去噪模糊等问题,提高了去噪效果。(3)D-D防御体系可以有效的提高对对抗样本攻击的防御能力,且对对抗样本攻击的防御具有很好的鲁棒性。