FLW查询代数物理实现方法的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:dnaln_xcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网的快速发展,越来越多的数据以XML的形式描述、交换和存储。作为W3C推荐的XML查询语言,XQuery语言受到了越来越广泛的关注。XQuery语言与XML数据库的关系就如同SQL语言与关系数据库的关系一样。因此要想高效地实现XQuery语言,就需要一个强大如关系代数的XML查询代数系统。现有的XML查询代数更多地关注如何正确、完整地表达语义,保证了关系数据库中常见的逻辑优化能够应用于XML查询,并不能很好地满足XQuery语言所描述的多层嵌套查询的优化需求。为了更好的满足这一需求,本文提出了一种新的XML查询代数系统——FLW查询代数。该查询代数包含逻辑层代数和物理层代数两部分。逻辑层代数包含一组逻辑算子,这些算子用于表示查询计划的逻辑关系,不涉及实际的查询实现,可以作为查询计划的逻辑优化的基础。物理层包含一组物理算子,用于实现实际的查询操作,包含各种连接运算、筛选运算和结果枚举运算。本文还提出了用于FLW查询代数的数据模型——FLW实例树。这是一种树型结构的数据模型。相比XQuery规范中提出的XQuery数据模型(XDM),这种数据模型可以减少冗余的数据存储,减小查询中间结果的数据规模,并且更有利于高效的XML树模式查询技术的应用。最后,本文给出了基于FLW实例树结构,所有物理算子的实现方法。作者在SelabQuery XML查询引擎中实现了以上设计,并以SelabQuery中原本采用的XQA查询代数为参照,分别在XQA查询代数和FLW查询代数环境下运行了一组XQuery查询,记录了查询执行的时间和空间消耗。实验结果表明,对于多数据源的XQuery查询,采用FLW查询代数,查询时间明显少于XQA查询代数,并且查询内存占用也少于XQA查询代数。与XQA查询代数相比,FLW查询代数的优势非常明显。
其他文献
"新疆油田公司网络安全机制的研究与建立"主要是从新疆油田公司网络的实际应用出发,根据建立的风险评估的模型,通过对公司下属十几个单位信息应用情况的调研情况进行风险分析
通过对BOSS系统计费、结算、帐务处理子系统整体功能分析,得出各个环节数据处理独立的,并发的线性顺序工作流表示.在基本遵照工作流概念的基础上,作业调度系统的多个工作流引
该文先简述了GIS技术的概念和发展趋势,并结合计算机软件技术的发展潮流,探讨了组件技术在GIS系统中的应用,并对ESRI ArcGIS产品中的组件技术进行了分析,探讨了ESRI ArcGIS在
本文首先通过分析和比较,说明采用Lotus Domino群件系统作为办公自动化系统开发平台的可靠性和优越性,以及开发Domino应用程序的设计方式和管理理念,并在此基础上详细地论述
已有的时序数据挖掘方法主要关注于时序数据在取值和时间两维上的总体信息,其知识生成过程主要是基于总体的、最显著的、全局的序列变化形式。但是对于很多数据挖掘问题,在取值
随着互联网的迅猛发展以及网络带宽逐年的扩容,使人们在网络上能做的事情不仅仅是文字信息,还有观看消耗大量带宽的视频数据,这些变化使在线收看视频甚至是高清视频成为现实,这是
该文对纹理合成的方法进行了深入的研究,分析了现有的代表性的方法的不足之处,在此基础上提出并实现了基于基因纹理合成方法的新思想.该文实现的基于基因的纹理合成算法,能在
企业应用集成是整合企业内外部不同应用系统间信息和业务流程的解决方案.Web Services是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性和语言独立性.本
自从中国改革开放以来,各行各业都得到了飞速的发展,民航业就是其中之一.导航是飞机飞行的重要保障手段之一,为了加强中国民航的硬件设施,满足民航发展的需要,中国民航总局引
目前Web已经发展成为全球最大的分布式共享信息资源库。但是因为Web上的信息数量庞大、动态性高,且缺乏统一的格式,导致现有的Web信息检索工具的检索效果持续下降,难以满足用户