多源异构漏洞样本搜索与融合分析方法研究

来源 :中国航天科工集团第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:lytmxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前漏洞样本来源种类繁多,样本属性大同小异,研究漏洞搜索方法与融合技术可更全面更高效地获取有价值的漏洞样本,解决样本冗余所带来的各种问题,帮助构建更完善统一的漏洞样本库。基于链接结构分析的搜索策略搜索搜集漏洞样本注重效率,同时兼备较高的准确性。进而,研究样本融合技术则有助于采集样本的属性更加精简完整,描述更加全面准确。  本文首先分析了漏洞样本分析方法中搜索与融合技术的国内外研究现状,针对搜索技术中算法性能损耗过高、效率较低等问题,提出了基于PageRank算法的改进方案,优化样本检索过程;针对融合技术中融合准确率较低、误差较大等问题,提出了形式化表示漏洞融合过程的数学模型,构建了基于相似度分析的样本融合系统,整合多源异构样本。  通过漏洞样本搜索方法的基础理论研究,分析了网页间的链接结构,得出PageRank算法可有效帮助搜索有价值较权威的漏洞样本信息。其中PageRank算法的幂法求解过程为提升效率的关键,进而针对该过程提出了该算法的二级加速优化方案。该方案将应用原点平移法对原始网络邻近矩阵进行预处理,实现算法的一级加速。通过对于迭代加速方法Aitken算法的研究,提出了相应的改进方案,进一步提升该算法的加速能力,并用于PageRank算法的加速中,实现了二级加速效果。最后结合当今大规模数据处理技术,将本方案基于Mapreduce架构实现并行化计算,从而完善基于PageRank算法的加速流程,显著提升了漏洞样本搜索时爬取网页信息过程的搜索效率。  其次,依据多源异构漏洞样本的数据特性,本文设计了一套以漏洞信息搜索与融合技术为核心的样本采集系统,并参考了各大权威漏洞信息平台发布的信息属性,筛选出其中九个高实用价值、高认可度的属性作为系统数据库保留属性。多源异构样本采集系统由两部分组成。漏洞样本搜索系统基于垂直搜索引擎结构进行设计,利用本文提出的PageRank算法改进方案多渠道有针对性的搜集漏洞样本,最终生成原始漏洞信息库;漏洞信息融合子系统主要面向原始漏洞信息库中的数据,多以CVE编号为区分漏洞样本依据,漏洞描述和影响产品属性为信息融合主要对象,依靠相似度分析算法进行去重与完善属性,并最终生成标准漏洞信息库供用户查询检索。  最后,分别搭建了实验环境以验证本文提出的改进PageRank算法和样本采集系统的功能性、有效性。通过实例证明了基于改进PageRank算法的优化方案可大大加速搜集样本过程,证实了融合系统在精简冗余信息的同时亦可保证漏洞样本属性的完整性与准确性。
其他文献
数字水印技术就是将水印信息嵌入到数字媒体中,然后通过对它的检测(提取)来对数字媒体的使用情况进行跟踪,从而实现隐藏传输、存储、版权保护等功能,它已经成为多媒体版权认证和完
图像非真实感绘制 (Non-photorealistic rendering:NPR)技术作为图像研究的一个重要研究分支,多数算法以点操作和邻域操作为基础,具有数据量大、计算密集和处理时间长的特点。用
随着现代社会对计算机技术需求的迅猛增长,软件系统变得越复杂,规模也迅速膨胀。系统复杂度的提高和第三方中间件的大量采用直接导致了大型软件系统运行过程中性能的不稳定,关键
早在20世纪60年代,散乱数据的插值问题就已引起人们的注意。近几十年来,已经有多种算法被提出来。但是,由于应用问题的千差万别,数据量大小不同,对连续性的要求也不同等等,没有一种
本文作者参与了VDSL业务其中主机软件部分的开发.主机软件代码使用商用RTOS系统Vxworks隔离硬件BSP,在VxWorks之上又采用了华为公司的公共软件平台Dopra系统,Dopra系统良好的
专利文献可以很直观的呈现出某项专利产品的技术特征和法律状态,它在推动专利技术传播、社会经济发展、科技技术进步方面做出了很大的贡献。根据世界知识产权组织的相关统计,可
杜继曾,曾用名杜省吾、杜省物等,1926年1月16日加入中国共产党。曾任中共牡丹江市委支部书记、中共大连市委委员、中共关东县委农运委员、苏豫皖边区行署法院院长、松江省方
可信恢复结合了安全操作系统的可用性和安全性需求,强调了系统失效后进行安全无损的恢复,它也是对高等级安全操作系统的重要要求。本文以SECIMOS和CAS-EARTH两个安全操作系统的
学位
2011年松江区新浜镇完成镇村集体产权制度改革,自2012年起实行村级资产委托镇级代管.为规范集体资产管理,依托市区健全的管理机制,结合本镇实际,整合资源、统筹力量、多管齐
期刊
计算机网络有效地实现了资源共享,但资源共享和信息安全是一对矛盾体。随着资源共享进一步加强,随之而来的信息安全问题也日益突出。 课题主要解决的问题是依据PKI体系结构