基于图的RDF数据流划分算法研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:fz594825946
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大图数据特别是数十亿顶点规模的图数据大量涌现,这一趋势对图数据管理领域提出了全新挑战。图的存储方式直接决定了图数据的访问效率、图查询与挖掘的效率。如何采用合适的划分方法处理大图数据,并能高效的存储和进行图运算,成为大规模图数据库领域需要迫切解决的问题。目前来看,大图存储的基本框架是分布式存储。图划分理论与方法,为解决该问题提供了有效途径。但是面对图数据库海量特点和分布式处理的日益复杂,现有的图划分模型和方法还存在一些不足。本文针对这些问题进行了研究和实验,设计了基于启发策略的图数据流划分算法,能够以较小的时间开销获得较理想的划分结果。主要工作包括以下几个方面:首先,介绍了当前图数据库的发展状况和图数据分区的的研究背景及意义,分析了该领域在国内外的研究现状,讨论了几类图划分模型的定义,并对目前图划分方法进行了总结和分析。主要包括:网格划分方法,谱聚类划分方法,启发式划分方法,多层划分方法等。其次,介绍了图数据流所涉及的概念,定义了图数据流划分的模型和分区启发函数策略,给出了针对图文件和RDF文件的图数据流划分算法和实现过程。最后,通过对几个真实RDF数据集的划分实验,并与METIS(一种多层次的图划分算法)方法和哈希分区方法做了实验数据对比,验证了图数据流划分算法的有效性。实验结果表明,图数据流启发划分算法相比传统的哈希分区方法,能有效地减少边割数量和通信交互,提高了图算法的性能;相比METIS方法减少了分区处理函数的时间消耗,并能更好的适用于大图数据库和增量图数据库。
其他文献
入侵检测是一种用于发现计算机网络或系统中违反安全策略的行为并对其做出反应的过程。通过对网络攻击类型和入侵检测方法的研究,发现常用的入侵检测方法不能很好的检测基于数
随着电能质量监测数据量的不断增长,系统复杂程度的不断增加,给电能质量智能信息系统的性能带来了很大的压力。主要表现在长时间的数据计算导致系统反应迟缓;大数据量的查询操作致使用户需要较长时间等待页面响应。这些性能问题将不利于电能质量研究的大范围开展和电能质量智能信息系统的推广使用。因此,有必要对电能质量智能信息系统的性能进行优化,提高系统运行效率、增强用户体验。本文重点研究了电能质量智能信息系统中的比
随着互联网技术的高速发展,P2P流媒体网络技术应用越来越广泛。由于传统的流媒体主要采用C/S模式,即客户端和服务器端的模式,客户端以单播方式和服务器端建立连接,服务器主要
图像分割是图像处理和机器视觉的基本主题,更是图像理解和分析的关键基础。随着机器视觉和图像识别技术的快速发展,图像处理的应用也越来越广泛,而图像分割的应用,也几乎渗透了有
随着计算机技术的高速发展和网络技术的迅速普及,信息的存储、处理和传输方式发生了根本变化,信息化、数字化、网络化已经成为信息系统的发展趋势。作为信息传输和数据交换的
学位
随着移动互联网技术的积累和发展,各种智能移动设备不断出现,传统行业与移动互联网的联系越来越密切。利用各种移动软件和智能网络我们可以轻松的处理我们的生活和工作,给我
分类是指通过对已知类别的样本集进行学习,来预测未知类别样本的过程。多标签分类允许一个样本同时拥有多个标签,并且标签之间可能存在一定的关联性。由于在现实中的应用广泛
日像仪是一种对日射电成像的大规模天线阵的综合孔径系统。获取理想的太阳亮度分布图像是日像仪的最终目标。而制约日像仪成像性能的最主要因素是有限的预算和天线数目之间的
P2P技术快速发展的同时,也导致了网络阻塞、网络安全性和网络资源产权保护等问题的产生,因此,通过研究有效的P2P流量识别方法,用以解决上述问题成为重要课题。  论文通过对比机