基于URL的钓鱼目标识别的研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:shuimeihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
钓鱼网站是网络攻击的主要形式之一,为了维护信息安全,各类钓鱼检测技术在不断改进,但目前针对钓鱼网站攻击目标的识别缺少专门的研究和解决方法,而确定攻击目标对有针对性地提醒用户和被攻击网站,使他们提前做出防范措施,及指导未来钓鱼网站的研究方向有重要意义。研究人员主要从URL、网页特征这两个角度进行钓鱼网站识别,而对其攻击目标进行识别只是作为钓鱼检测的一个附加功能,也是从URL和网页特征中进行初步的识别,准确率较低,而且特征提取的复杂度较高。同时,攻击者也在不断更新攻击方式来逃避各种钓鱼网站识别技术。为了应对钓鱼者的检测逃避策略,同时准确识别出其意图攻击的目标,本文对此展开钓鱼目标识别的研究,本文主要内容如下:(1)提出基于URL相似性的目标识别算法。通过对URL中域名字符串的相似性分析,改进编辑距离的计算方式来识别利用填充字符实现逃避检测的钓鱼网站,另外通过确定候选目标减少编辑距离的计算次数,提高算法的整体效率。(2)提出基于URL语言特征的钓鱼网站识别算法。对于无法从URL上直接识别出目标的网站,通过分析URL蕴含的语言特征选择可以有效分类的域名特征,利用域名特征建立决策树分类模型实现对钓鱼网站的识别,另外对决策树进行改进,减少并简化信息增益率的计算,以提高建立决策树的效率。(3)提出基于搜索引擎的目标识别算法。对于识别出的钓鱼网站,分析HTML中各个标签的特点选取有效的检索关键词,通过在三种搜索引擎中检索和对关键词去编码化改进检索过程,以消除单搜索引擎的误判并识别出钓鱼者利用unicode编码逃避检测的策略,实现对钓鱼网站识别结果的补充和修正。(4)在MapReduce上分别设计目标识别算法和钓鱼网站识别算法的并行化方案,以提高确定候选目标、计算编辑距离、建立决策树以及利用搜索引擎识别攻击目标的效率。
其他文献
本文以某道路工程下穿地铁既有线为工程背景,利用大型有限元软件ANSYS建立了合理的有限元模型,通过模拟盾构开挖过程,分析了既有不同距离隧道在地层加固后的主应力,得出了交
①目的探讨锁骨下静脉穿刺置管术发生并发症的原因及其防止对策.②方法对173例实施锁骨下静脉置管患者的临床资料进行回顾性分析.③结果 173例患者中出现并发症者40例,其中气
<正>2018年9月22日至23日,由国家创新与发展战略研究会和中国科学院自然辩证法通讯杂志社联合主办的从"科学的春天"开始——纪念《自然辩证法通讯》(以下简称《通讯》)创刊40
构建和谐社会,重心在基层,基础在社区。近年来,由中核集团公司七一九矿改制而成立的赣州七一九社区从构建平安和谐社区的目标出发,从创新社区的工作思路、组织设置和活动载体
期刊
本文在TAM中引入感知亲社会变量,通过实证研究,量化分析了态度和低碳相关的五个因素对于通勤者出行行为意向的影响及其内在关系。实证分析结果显示,功能因素、低碳意识、低碳
在小说《祝福》中鲁迅先生着力塑造了祥林嫂这一勤劳、善良、朴实的农村妇女形象。作品通过对她一生悲惨命运的描绘,深刻揭露了封建礼教对鲜活生命的摧残和迫害。在大多数人看
大学精神是一所大学的灵魂之所在,其本质蕴含了深刻的德性要求并承载着丰富的德性内容,也提出其承载主体之大学教师的高尚师德要求。高校教师良好师德之形成,又有赖于特定大
<正>一、滨海新区开放双向化滨海新区作为天津市对外开放的重点区域,面对世界经济一体化进程的加快和中国加入WTO的新形势,必须努力适应形势变化,充分发挥新区综合优势,采取
弹性力学问题的基本方程不仅包括平衡微分方程、几何方程和物理方程,还包括应力边界条件和位移边界条件.各种物体在不同外力、不同约束条件下其边界条件往往不同,正是由于实
温度是影响锂离子动力电池性能的关键因素,本文采用平板热管作为电池热管理的传热部件,实验研究了平板热管在不同电池产热功率条件下的传热性能和均温性,理论计算了平板热管