论文部分内容阅读
由于网络的快速发展和广泛传播,互联网产生的数据信息大量增加,不法分子利用网络流量中暴露的个人隐私信息,以及网络的虚拟性与不易追踪性,对使用者散播反人类的不良信息,甚至利用互联网的漏洞,窃取用户财产,在严重影响到使用者个人生活的同时,网络数据量的庞大以及分散性还极大地增加了相关部门侦查案件的工作难度。为了对海量数据中的有效数据进行筛选与关联,减少数据分析过程中的工作量,避免传统数据库的数据载体式存储,以及数据之间缺乏的内在关联性。本文将语义网技术应用到网络威胁情报分析系统中,对如何为数据添加语义信息进行了研究,并将含有语义的数据信息通过本体模型进行关联筛选,形成语义知识元数据库,最后完成数据的获取。1、提出以语义网技术为基础的后台数据关联方法。通过对语义网体系结构的研究,并深入探索了语义网体系结构中核心的三部分:XML、RDF资源描述框架以及本体模型,为分散、杂乱且庞大的数据添加语义信息,使得计算机能够理解数据内容。2、构建本体模型规则。确定不同类别的安全域情报分析数据,结合社交网络、VPN与FreeGate的数据特点,提取概念的语义信息,构建抽象数据模型,集成网络拓扑发现技术,构建适合网络安全领域后台数据关联的本体模型。3、基于领域本体的数据获取研究与应用。将标注语义信息的数据与本体模型进行映射,对数据进行关联与推理,形成知识元数据库,通过Fuseki语义框架获取知识元数据,最后根据Sparql提供的数据获取协议,实现知识元数据的获取与推理。4、设计适合系统后台数据的关联与推理的技术方案。通过编码实现对应的技术方案,应用模型与知识元数据库到分析系统中,依据网络场景的特征,对数据信息进行分析定位,验证各个模块的有效性和技术方案的准确性与可靠性。基于语义网的网络威胁情报分析系统,通过真实数据的应用测试,完成了对大量数据的过滤筛选以及关联推理,验证了数据之间的关联性、有效性以及可靠性,能够有效提升相关部门对于网络海量数据中关键内容的定位关联与分析。