基于数据挖掘与自动推理的未知通信协议分析

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ak328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今世界,网络与信息技术日新月异,提高互联网的安全保障能力已成为我国构建强大网络战略的重要组成部分,信息战也成为决定现代战争胜负的关键因素,而可靠的信息交互依赖于通信协议,因此,对敌方通信信息进行分析,进而获得通信协议的结构,为通信情报的获取及有效的信息对抗手段的采取提供依据是一个重要的研究课题。论文研究的对象是具有固定帧头格式的未知通信协议,通过获得的大量未知通信协议的原始数据,寻找其隐藏的协议规律。从大量的比特流数据中对未知协议进行识别,首先需要实现对比特流数据中数据帧的完整切割,然后需要从切分得到的数据帧中提取正确的协议特征信息,最后基于协议特征对协议进行归类。为了解决上述关键问题,本文提出了零先验知识情况下的基于频繁串提取的帧定位方法和基于聚类的帧特征分析方法。论文的主要工作有:1、针对基于频繁串提取的帧定位方法,本文通过数据单元切分、Jaccard参数筛选和基于关联规则的频繁序列拼接来识别比特流数据中的同步码序列,利用汉明距离对流数据中的同步码进行定位,以此实现帧切割。2、针对基于聚类的帧特征分析方法,将频繁序列的位置信息作为参考条件,根据频繁串及其位置信息构建二维复合特征,实现降低特征序列维数的同时准确提取出协议的特征。3、通过对两种典型的聚类算法,K-means和DBSCAN算法进行研究和性能分析,考虑到未知协议分析中缺乏先验知识以及比特流序列缺乏语义的条件,对聚类算法进行改进以适用于比特流数据。依据提取出的特征对协议进行向量转化,通过改进的聚类算法将具有相似帧格式的协议聚为一簇。4、为了对本文所提算法的有效性和准确性进行验证,分别以标准数据集和采集的以太网通信数据作为输入数据,设计相应的实验进行验证和评估。采用两种典型的聚类算法对不同帧格式数据进行聚类,以准确率和计算时间为评价指标对聚类算法进行了比较,总结了算法的优点和局限性。实验结果表明,论文提出的方法,能够从大量的比特流数据中实现准确的帧定界和切分,对于结构相对简单的协议,可以有效的识别出不同格式的数据帧。
其他文献
本文以女性主义与男权中心意识对比,借助具体作品展开人物分析,探秘理想新女性形象的相似与差异,在国别背景下透析各自的成因及作者本人的思想路程,进而明晰两者新女性的抒写
通过对传统气控系统设计存在问题的分析和研究,对ZJ70DB型电动钻机气控系统中的送钻离合器、换挡装置等设备的气动控制进行了优化设计,并在气控系统中增设了故障报警显示功能
对炼钢温度下CO2与熔池元素的反应机理进行了研究,并进行了相关热力学和动力学分析.利用30 t转炉进行顶底复吹CO2气体的炼钢工艺试验.试验结果表明:采用顶底复吹CO2试验炉次
双层股权结构不同于传统的“一股一表决权”。长期以来,不同表决权股份被认为是对股东平等原则的背离,并且在权利和义务不匹配的情况下,这种结构加剧了公司的代理成本、损害中小股东的权益。然而,公司自治的发展、股东异质化的现实以及表决权与股份的分离主义倾向都证明了双层股权制度的引入有其独特的实践需求。双层股权结构解决了公司在融资时股权稀释与控制权保持的矛盾问题,在提高公司运行效率、有利于公司长期发展方面也有
《普通高中数学课程标准(2017年版)》突出了贯穿高中数学课程的四条主线,即函数、几何与代数、统计与概率,以及强调应用的数学建模活动与数学探究活动。函数作为四条主线之一,
针对滚动轴承故障振动信号的非平稳特征,提出了基于经验模态分解(Empiri calModeDecomposition,简称EMD)和神经网络的滚动轴承故障诊断方法.首先对原始信号进行了经验模态分
综述了戊二醛(GA)主要用途并比较目前几种合成工艺方法的优缺点,其中吡喃法synthesis是国内外普遍采用的合成方法,该方法以技术难度小、污染小、产品质量好、工艺成熟而成为目前
横电磁波传输室(TEM室)是电磁兼容性测试领域的重要装置,特别是作为电磁场传感器校准和计量的溯源装置,为电磁场的准确测量标定提供了依据。但高次模限制了测试上限频率和空
钢铁生产过程CO2排放占工业CO2排放量的16%左右。如何降低CO2排放并使CO2进行资源化利用是钢铁工作者关心的重要问题。以CO2在炼钢过程中的资源化利用为出发点,分析了国内外C
目的:上皮性卵巢癌转移中miR-29C的表达差异与功能鉴定方法:选取2012年3月至2014年11月在襄阳中心医院妇科肿瘤科收集的120例诊断为上皮性卵巢癌患者。所有患者在组织病理学