基于后裔聚集F&B索引的XML数据查询处理算法

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:caijunever
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文件在互联网上的广泛使用,使得高效XML文件查询算法成为日益迫切的需求,必须研究有效的磁盘算法.目前基于磁盘的高效查询算法首先把XML文件映射成树模型,然后主要有两类方法:1)基于遍历的算法,在树结构上执行遍历操作,判断当前访问节点都否满足约束条件;2)基于join的算法,首先选择一系列满足某个约束条件的XML树节点集合,然后根据彼此之间结构关系(祖先后代或父子关系)[2,3]做交.这两种方法在//查询(祖先后代关系,下文简称AD)的时候,都存在不足之处.基于遍历的方法需要遍历祖先节点的整棵子树来寻找后代节点,为了访问一个目标点,往往要遍历许多不属于查询结果的结点,这就带来了大量无用IO操作;基于join的方法在选择满足约束条件的候选节点的时候要读取所有的相同标签的节点.一般而言不可能所有节点都符合AD约束,所以造成大量无用IO操作. 本文在F&B index的基础上提出了一种基于后裔聚集的存储结构,提出了BFS算法和DFS算法,同时针对没有条件的后代查询提出了FLFS算法.经过实验检验,大大加速查询的处理速度.算法有着很好的可扩展性,需要的内存量很小。
其他文献
近来许多应用领域如股票数据、网络流量监控,点击流、传感器网络、电话记录等领域中需要处理数据流问题,所以数据流的问题越来越引起人们的关注.而频繁模式的发现通常又是其
会议
同关系数据库相似,XML数据的冗余也会引起更新异常.而由于Internet的开放性,XML数据更新异常的危害性远远大于关系数据.因此,对引起XML数据更新异常的原因及消除更新异常的方
会议
随着企业电子商务的飞速发展,XML文档渐渐成为电子商务中数据传输的主要载体.而目前,出于XML文档的解析困难、管理不方便等各方面的原因,大多数企业的数据都采用关系数据库的
会议
近来,XML已经成为Web上信息发布和信息交换的事实标准.许多数据源输出XML格式的数据,并发布相应的DTD或Schema.因此,无论数据是以XML文档的形式存储,还是存储在关系数据库,呈
会议
目的:对乳腺癌保乳术后设计不同的照射技术进行剂量学分析研究. 材料方法:选用15例乳腺癌保乳术后病例,使用PHILIPS公司ADAC7.6c版本的三维逆向治疗计划系统,用siemens pr
会议
1998年2月,万维网协会(W3C)推出了可扩展的标记语言XML(eXtensible Markup Language)作为Web上进行半结构化数据传输与交换的标准.随着XML的出现,XML数据相关技术研究成为热
会议
XML已经成为互联网上数据表示和交换的标准,大量的XML文档出现在网络中,有效地存储XML数据并提供高效的XML数据查询,成为当今急需解决的问题.目前,大部分有关XML数据的索引和
会议
随着XML的广泛应用,XML查询求解成为目前一个非常重要的热点问题.为了高效且正确地处理XML分支查询求解的问题,本文在SCALER算法的基础上提出了SCALER+算法. SCALER+算法
会议
XML(eXtended Markup Language)在文档展现和交换领域得到了广泛的认同,并已经成为Internet上数据交换的事实标准.目前对XML的研究主要集中在如何有效地对XML文档进行查询、
会议
XML是W3C为适应Internet发展而推出的新标记语言.随着大量XML数据的出现,如何有效地管理这些数据已成为必须解决的重要问题. 目前基于关系数据库的XML存储和查询的一般策
会议