精确子图数据库查询技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zxcvbnmzhaowei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种通用的数据结构,相比路径和树结构来说,图能表达更多复杂的结构信息,如:分子结构、社交网络关系、图像。近年来,随着图数据在各个应用领域内被广泛使用,其数据量成指数级迅速积累,导致对这些海量数据的管理成为一项重要的研究工作。图数据管理中重要的分支之一是子图查询技术研究。图查询技术具有自己的特点与难点:1、数据结构相对其他较复杂,操纵困难。2、子图同构问题在精确子图查询过程中是不可避免的,而且已被证明是NP难问题。3、图数据种类繁杂。为了解决这一系列的问题,使得图查询技术的研究充满了挑战与机遇。本文针对图数据库中的精确子图查询技术,主要完成了以下工作:(1)根据现有频繁子图挖掘算法,选取高效的频繁子图挖掘算法作为本论文的离线挖掘算法。通过对AGM、FSG、g Span算法的对比,得出基于深度挖掘的g Span算法的通用性与高效性,相比基于宽度优先挖掘的算法来说:1、使用DFS码对图进行编码,避免了匹配过程中的子图同构问题。2、避免了Apriori逐层扩展产生的大量中间结果带来的计算开销。(2)结合频繁模式特征挖掘算法,提出一种新的基于频繁子图中邻接边哈希索引构建方法AG-Index:利用过滤-验证模型,对频繁图部分构建索引存入缓存内,非频繁部分放在磁盘,得到候选项后用现有效率较高的子图同构算法进行验证。实验证明,AG-Index比经典高效的g Index和FG-Index算法过滤能力更强,内存占有率更小,并在AG-Index的基础上对其进行了更进一步的优化,实验证明,其过滤能力在AG-Index上有所提升,其他方面有待探究。(3)子图同构算法设计,结合现有常用Ullmann、VF2子图同构算法:1、在Ullmann算法基础上利用邻接边结构等信息对其进行剪枝,实验证明,剪枝后的Ullmann查询效率比剪枝前提高了一个数量级。2、在VF2算法上调整顶点的考察匹配顺序,实验证明与按标号大小顺序遍历节点相比,按节点度数大小顺序匹配在图大小为8时的效率更高,更容易快速剪枝不是子图同构的情况。
其他文献
数字视频和音频压缩技术的进步,以及网络和通信技术的发展,使得在传输介质上传送实时视频和音频信息已经步入了实用化阶段,这就为数字电视的产生提供了条件。针对数字音视频
《中国海洋发展报告2014》围绕党的十八大提出的建设海洋强国战略部署和2013年政府工作报告的要求,结合2013年海洋事业发展和海洋领域发生的重大事件,全面论述了中国海洋事业发
随着数据库技术的飞速发展以及数据库管理系统的广泛应用,人们收集数据的能力有了巨大的提高,积累的数据越来越多。在这浩瀚无边的数据海洋中潜藏着大量重要的、有趣的信息。
随着网络的快速发展,网络学习资源越来越丰富,人们开始通过互联网学习感兴趣的知识,代替传统的学习模式。虽然网络学习资源丰富,但是由于学习网站大量存在,且相互之间对于知识层次
随着移动通信的迅速发展,人们不再满足于仅有的文本、声音、图像,而是希望得到声、文、图及视频流媒体信息。而第三代移动通信网络(3G)不仅继承了时分多址接入(TDMA)技术,还
现在生物信息学已经成为了一门飞速发展的学科,前期研究人员注重对局部数据的处理与分析,随着这种局部数据的增加,人们把注意力移向了更高的层次,希望从系统的角度来研究分析
随着信息技术的迅速发展,特别是Internet与Intranet应用的飞速发展,信息共享、信息交换通过开放式网络形成一个方便快捷的信息传播平台,为计算机的普及提供了有利的条件。同
云计算是目前商业与科研方面的研究热点,Hadoop作为Google云平台的开源实现,为广大研究人员提供了研究基础。在Hadoop架构中,MapReduce调度算法决定了作业调度的先后顺序与作
在互联网上,每台计算机都存在或多或少的安全问题。安全问题不被重视,必然会导致严重后果,造成系统被破坏、数据丢失、机密信息被盗等各种直接和间接经济损失。本文正是从网
随着计算机网络和通信技术的迅速发展以及网络应用的飞速普及,网络用户对网络服务提出的要求也与时俱进。即时通讯作为众多网络服务中最成功的网络服务之一,它已经从过去纯粹的