【摘 要】
:
随着互联网技术的发展,电子计算机大大方便了我们的生活,但于此同时也带来了很多新的安全隐患。在Web安全领域,Http报文中的URL一直是黑客实施网络攻击的重要载体,黑客可以借助URL实施网站钓鱼、跨站脚本、SQL注入等攻击,这些试图攻击他人计算机的URL被称为恶意URL,恶意URL给个人、社会乃至国家造成了很严重的损失。因此,对URL进行有效的检测是十分有必要的,简单的黑名单等传统检测算法已难以应
论文部分内容阅读
随着互联网技术的发展,电子计算机大大方便了我们的生活,但于此同时也带来了很多新的安全隐患。在Web安全领域,Http报文中的URL一直是黑客实施网络攻击的重要载体,黑客可以借助URL实施网站钓鱼、跨站脚本、SQL注入等攻击,这些试图攻击他人计算机的URL被称为恶意URL,恶意URL给个人、社会乃至国家造成了很严重的损失。因此,对URL进行有效的检测是十分有必要的,简单的黑名单等传统检测算法已难以应对日新月异的攻击方式。由于大数据的驱动和硬件计算性能的提升,将机器学习算法应用于URL检测成为一种可能。现有的机器学习检测算法往往使用单一模型,这种方式容易被攻击者绕过甚至击溃。本文致力于对恶意URL检测的关键技术进行研究,同时借鉴和吸收自然语言处理领域相关的研究成果,将其应用于恶意URL的检测研究中去。本文的主要工作和贡献可以归纳为:1.分别从真实的Web服务器和开源社区收集了大量数据集,并对原始数据进行清洗,均衡等数据处理操作。2.在经验特征和TF-IDF统计特征提取的基础上,研究并实现了三种基于传统机器学习的URL检测模型,分别是支持向量机、决策树和随机森林。3.按照特殊字符对URL进行单词级分词,并在此基础上使用Word2vec模型将单词映射到向量空间,实现对URL的向量化工作。随后分别使用LSTM-attention和Text CNN深度学习模型,完成对URL的检测任务。4.针对LSTM网络模型在处理较长URL攻击特征会遭到淡化的问题,在原有LSTM网络的基础上进行改进,形成了一种基于自主特征选择的长短时间记忆神经网络(Automatic Feature Select Long Short Term Memory,AFSLSTM)的URL检测模型,该模型能够自主提取与恶意URL分类任务最相关的特征,并通过对模型的训练和测试,证明该模型具有较高的检测准确率。5.通过对原始URL向量矩阵的平均池化,得到体现全局特征的URL特征向量,并使用一维CNN网络对该特征向量进行更高维的特征提取工作,形成了全局特征卷积神经网络(Global Feature Convolutional Neural Networks,GFCNN)。6.在AFSLSTM网络和GFCNN网络的基础上,提出了融合深度学习判决模型,并经过实验证明该模型能够实现对恶意URL更加有效的检测。
其他文献
河北省自行车项目曾在中国竞技自行车史上创下许多纪录,河北队员曾多次代表中国参加国际自行车大赛并取得了骄人的成绩,当时的河北省自行车项目在全国同行业中处于领先水平。而近年来河北省自行车水平处于逐渐下滑阶段。究其原因,河北省竞技自行车后备人才培养的体制、机制、模式是不可忽视的关键因素,所以有必要对后备人才的培养工作进行研究,以找出其中的问题并对河北省竞技自行车后备人才的培养工作提出有针对性建议,以提高
在嵌入式系统中进行实时的音频信号处理不仅要求处理系统具有足额的并行处理能力,同时由于不同应用场景下的不同精度需求,系统也需要保留一定通用性以覆盖更多的应用场景,向量处理器则恰好能同时满足这两点。RISC-V向量指令集作为近年来最新出现的向量体系结构指令集,与其余向量指令集的架构定义相比,RISC-V向量指令集的指令功能更为独立,对任意向量长度处理更为简洁,指令编码与RISC-V标量指令集也高度匹配
随着海量数据的产生,数据出错变得愈发常见,容错成为存储系统不可或缺的一部分,纠删码技术是目前分布式存储系统广泛应用的容错技术,相较于传统的多副本冗余技术节约了大量的存储开销。为使分布式存储系统同时具有高性能和高可靠性,具有高访问性能的内存存储结合纠删码技术被广泛应用在分布式存储系统中。然而集群的扩展导致节点性能降级现象频发,出现严重的长尾延迟问题,尾延迟虽然占比少,但在分布式存储系统中却成为了系统
自乒乓成为一个国际比赛项目之后,我国乒乓运动一直居于世界的主导地位,因此为了使乒乓赛事更具有观赏性、也为限制中国队长期以来的统治地位,国际乒联针对乒乓球项目做出了大量的改革。但是随改革而来的还有对运动员打法的改变,使得原来颗粒胶打法的运动员受到了很大的冲击。取而代之的是运动员对反胶胶皮的使用率越来越高,尤其是两面反胶弧圈结合快攻技术的使用。然而颗粒胶打法具有速度快、球风怪、变化多的优势,在比赛中也
对页岩气的挖掘开采是国家能源发展战略的重要方针,也是保障我国能源安全的重要途径。但盲目地进行页岩气井的开发投产并不可取;为了页岩气开发的高效益,对页岩气井进行产量预测成为了油气领域中关注的重点。而当前的产量预测的研究往往需要先建立理想化条件下的数学模型,这使得其在实际应用中的预测精准度并不高。另一方面,随着页岩气井的陆续开发,积累了大量地质数据、施工数据和生产数据。因此,本文构建基于分布式存储的大
研究目的:通过实验所得的生物力学相关数据,研究男子排球运动员原地起跳拦网技术的动作特征,并对比分析该技术动作不同等级组之间存在的差异,从而探讨不同等级运动员该技术的动作特点,以便从根本上认识原地起跳拦网动作,改善运动员技术动作,为排球运动的专业化训练提供科学有效的理论依据。研究方法:使用Qualisys动作捕捉系统和Bertec三维测力平台对内蒙古师范大学26名男子排球运动员的原地起跳拦网技术动作
太极拳作为东方大国智慧的鲜明符号,它蕴含着我国优秀传统文化血脉,集聚着儒家、哲学、易经等多种传统文化思想,太极拳已然成为东方名片的代名词,是华夏文明精髓的重要蕴聚。太极拳的国际化发展和推进,为竞技太极拳的发展奠定基石,在全球国际化背景的有力支持下,竞技太极拳在竞技武术中地位尤为突出。竞技太极拳作为现代武术运动的主要构成部分以及展现形式,已在国际化武术竞赛中具有至关重要的位置。本文运用文献资料、问卷
随着中国人口老龄化的加剧,我们应该更加关注老年人的身体健康,在日常运动中对老年人进行运动监测,能更好的帮助老年人进行合理的运动,有利于老年人的健康。同时老年人在日常运动中可能面临跌倒的风险,因此还需要对老年人的跌倒进行识别。目前运动监测主要分为基于视觉的运动监测和基于穿戴式传感器的运动监测,基于视觉的运动监测往往监测范围不广,而且受到环境的影响较大,难以进行长期准确的监测,同时还侵犯隐私。基于穿戴
自1945年日本女性首次获得参政权以来,一直到20世纪80年代末,日本女性的参政情况持续低迷,1989年社会党首位女党首土井多贺子掀起“土井旋风”,带领日本女性参政迈入跃进的90年代。但到了21世纪,日本女性的参政情况发生了新的变化,虽然女性议员的比例不断上升,女性相关政策的制定却陷入了停滞甚至倒退的状态,女性在日本政界的身份和地位也发生了变化。本文将以明治维新至1989年日本女性参政历史为背景,
私函理公务是隆庆、万历时期张居正理政的显著特征。隆庆时,张居正由末相逐渐升为次辅,为避免与首辅的冲突,与下属常有政务上的书信往来,用以互通信息、交流意见,以迂回的方式影响朝廷决策。万历初年,主少国疑,张居正乾纲独断,延续私函理政的习惯,以作为正常公文文书的补充。张居正以私函理公务的方式作为常规理政方式的补充,将政务安排直接下达至相关官员,推动各项政策的落实。因此,其书信中涉及的政务信息极多,除了他