基于XML Schema的查询优化技术的研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:oldfly2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于XML数据具有半结构化和自描述的特点,使得其得到了越来越广泛的应用,并成为互联网上信息表示和交换的标准。鉴于XML数据的半结构化数据特点,对XML数据的存储和查询要比关系数据库复杂和繁琐。XPath和XQuery作为XML通用的查询语言,可以从XML数据库中提取出用户所需要的信息,并将查询结果组织为XML文档,但是随着XML数据量大幅度地增长,如何有效的存储和查询大规模的XML数据成为数据库领域研究的一个热点问题。本文在分析XML查询的相关问题、特别是XML查询优化技术的基础之上,介绍了基于XML Schema查询优化系统的设计思想。该系统使用XML作为数据模型,以XQuery语言作为查询语言的方法,利用XML Schema所提供的结构信息来重写XQuery的方式来实现对XML查询处理的优化,优化工作主要包括将XPath表达式中模糊的查询转换为更加精确的查询以及删除冗余谓词等。此外,本文提出了一种新的算法——TwigList-By-PDT算法来处理小枝查询,该算法使用XML Schema类型信息来优化小枝查询,缩小了小枝模式匹配过程中路径匹配范围,减少了对XML文档中不必要节点的访问。在查询处理过程中,随着XML数据量大幅度地增长,XML中无用数据存储增加了XML查询处理的空间开销。针对该问题,本文介绍了XML延时加载机制,该机制根据查询请求将查询所涉及到的XML数据加载到内存,避免了不必要的空间开销。
其他文献
普适计算是信息空间与物理空间的融合,在这个融合的空间中人们可以随时随地和透明地获得数字化的服务;普适环境中上下文感知系统成为新兴的研究领域。而作为上下文感知计算的核
学位
科技文献是由文章的作者、标题、摘要、子标题、正文和参考文献等内容组成的,这些内容构成了科技文献的结构化特征。现有的科技文献检索系统都是基于关键词的检索,就是指将科
学位
手语是听力障碍者的第一语言,在听力障碍者之间及他们与健听人交流时被广泛使用。由于听力障碍者很难形成完整有效的书面语言能力,因此创建具有普适能力的手语合成系统具有很强
学位
机器人足球比赛已经成为当前人工智能和机器人领域的研究热点之一,其中,全自主足球机器人有着巨大的应用潜力,其应用领域包括自动驾驶、导游、未知区域的探索、核电站的维护
随着Andriod系统的流行,越来越多的开发者从事Android应用的开发并设计出了大量优秀的Android应用,这些应用满足了用户的各种需求。随着开发能力的提高,对移动设备性能有较高
针对连续型变量与离散型变量的多目标优化问题,分别提出基于博弈策略的多目标粒子群优化算法和面向旅行商问题(TSP)的协同进化粒子群优化算法。围绕群智能算法的优化原理与多
RDF数据是语义网上的一种重要数据。它们之间的关系需要推理机进行推理才可以获得,但是由于语义网上的RDF数据量规模性较大,语义网上传统的推理机不能很好处理这种大规模数据
学位
尽管搜索引擎极大的方便了人们在Web上进行信息查找,但其还是有着很多的缺点。问答系统以其符合普通用户习惯的表达方式、返回简单准确的答案弥补了搜索引擎的不足,成为信息检
学位
通过对MN的移动习惯进行形式化分析和解释性论证,针对切换时延、数据分组连续性和切换花费等关键问题,提出使用机器学习算法进行切换行为预测的智能辅助方案。为了降低MAG和L
作为支持互联网大规模图像检索的一种有效和实用方法,互联网图像自动标注和理解已成为学术界和产业界的热点问题而被深入研究。本文研究了图像视觉内容与伴随文本语义之间的潜