论文部分内容阅读
二十一世纪是信息化的时代,网络的使用率更是达到了空前的高度,网络的应用也早已遍布各行各业。值得注意的是,人们享受着网络给予的各种好处的同时,也因网络所具有的匿名开放、交互分散等特性,容易受到各类安全威胁的影响。更为严重的是,在这些特性的加持下,网络攻击造成的伤害比以往更为严重,影响也更为广泛。网络上的信息浩如烟海,信息传递渠道多如牛毛,如何在这样的背景下,有效的防范各类安全威胁,是新时代对网络安全提出的新要求,这不仅需要以往的攻防对抗经验,更需要依赖一些大数据技术手段,才能应对海量样本,并给出快速有效的响应。这也是将K-means聚类算法和逻辑回归模型引入网络安全研究的初衷。
目前,网络安全威胁的主要防范技术主要包括:数字签名与CA认证技术、防火墙技术、反病毒技术等。本文将通过分析和比对,给出这几类防范技术的利弊。并着力于反病毒技术这一方面,阐述病毒分析的流程和其中容易遇到的问题,探究如何引入大数据技术来更好的解决问题,结合实际工作给出解决方案。本文将大数据技术中的聚类算法与逻辑回归模型应用于病毒分析流程中,以实现对未知样本的快速聚类,并对这些样本进行快速有效的分析。
病毒防治安全厂商每天都能够收到成千上万甚至数以亿计的病毒样本,如何快速处理海量病毒成了关键问题,目前多数的处理办法是提取病毒共性使其家族化,随后再以病毒家族为单位进行研究。
本文在对病毒家族聚类的相关研究进行梳理的基础上,探索总结了适合应用于海量样本聚类的算法,并使其尽量满足复杂度低,时效性高。从而为实际应用打下良好基础。除此之外,本文实现了一个预测样本结果的逻辑回归模型,可以自动对样本进行分析并输出预测结果,该模型内置可信度打分系统,高可信度的结果经测验可以直接使用,该模型的应用也可大大的减少繁复的人工分析流程。鉴于大数据技术手段在网络安全方面,尤其是样本聚类和结果预测方面的应用还是相对较少,该方向的任何尝试都是具有一定的理论和实践意义的。
最后,本文对新兴网络安全领域进行了探究,给出了大数据技术手段应用方向的探究和思索。
目前,网络安全威胁的主要防范技术主要包括:数字签名与CA认证技术、防火墙技术、反病毒技术等。本文将通过分析和比对,给出这几类防范技术的利弊。并着力于反病毒技术这一方面,阐述病毒分析的流程和其中容易遇到的问题,探究如何引入大数据技术来更好的解决问题,结合实际工作给出解决方案。本文将大数据技术中的聚类算法与逻辑回归模型应用于病毒分析流程中,以实现对未知样本的快速聚类,并对这些样本进行快速有效的分析。
病毒防治安全厂商每天都能够收到成千上万甚至数以亿计的病毒样本,如何快速处理海量病毒成了关键问题,目前多数的处理办法是提取病毒共性使其家族化,随后再以病毒家族为单位进行研究。
本文在对病毒家族聚类的相关研究进行梳理的基础上,探索总结了适合应用于海量样本聚类的算法,并使其尽量满足复杂度低,时效性高。从而为实际应用打下良好基础。除此之外,本文实现了一个预测样本结果的逻辑回归模型,可以自动对样本进行分析并输出预测结果,该模型内置可信度打分系统,高可信度的结果经测验可以直接使用,该模型的应用也可大大的减少繁复的人工分析流程。鉴于大数据技术手段在网络安全方面,尤其是样本聚类和结果预测方面的应用还是相对较少,该方向的任何尝试都是具有一定的理论和实践意义的。
最后,本文对新兴网络安全领域进行了探究,给出了大数据技术手段应用方向的探究和思索。