【摘 要】
:
XML已经成为互联网上数据表示和交换的标准,大量的XML文档出现在网络中,有效地存储XML数据并提供高效的XML数据查询,成为当今急需解决的问题.目前,大部分有关XML数据的索引和
【机 构】
:
西北工业大学计算机学院,西安,710072
【出 处】
:
第二十三届中国数据库学术会议(NDBC2006)
论文部分内容阅读
XML已经成为互联网上数据表示和交换的标准,大量的XML文档出现在网络中,有效地存储XML数据并提供高效的XML数据查询,成为当今急需解决的问题.目前,大部分有关XML数据的索引和查询技术都是基于某种对XML文档树的编码技术,区间编码是一种主流的编码方式.
XML编码技术,就是按照一定规则给XML文档树中的每一个结点分配唯一的编码.通过编码,可以在不遍历XML文档树的前提下,直接判断两个结点之间的关系.区间编码采用深度优先遍历XML文档树的方式给树中的每个结点赋予一对整数值,祖先结点的编码区间包含其后裔结点的编码区间,这样对结点间结构关系的判断就等价于区间包含关系的判断.本文对现有的区间编码方案进行分析比较,研究了XML文档树中结点的位置特性,提出一种基于更新代价的XML区间编码方案。
本文分析了现有的几种XML文档区间编码方法,研究了在XML文档树不同位置插入结点或子树造成重新编码结点的数量,即更新代价,提出了一种新的区间编码方式,给出了明确的结点编码的计算表达式.该方法对更新代价较大的结点预留较大的空间,而对于更新代价较小的结点预留较小的空间.通过分析证明,采用本文提出的编码方法,在常数复杂度的时间内实现任意两个元素间父子、祖先/后裔、兄弟等关系的判断,同时,本编码方法便于XML文档更新,与现有XML文档的区间编码方式相比,可以更好地解决更新操作所造成的结点重新编码的问题。
其他文献
传统的宏观经济学是在数学和统计的基础上发展起来的,已取得一些成绩.但以往的宏观经济管理多采用常规方法,以单纯的经验判断为基础,缺乏系统的观点,忽视精密的数量计算,管理
自从WWW问世以来,其信息容量飞速增长.由于Internet是一个开放性、动态性和异构性的全球分布式网络,信息资源分布非常分散,没有统一的管理机构,从而导致了信息获取的困难.
今年是中国植物学会成立五十周年,许多会员自然会联想到学会的创始人之一,连任多年的理事长,钱崇澍老先生。在1963年中国植物学会三十周年庆祝会上,曾经共同祝贺了钱老的八
随着XML数据的应用范围和复杂度的快速增长,各种应用对XML数据的查询、定位和获取的需求不断增加,引发了对XML数据进行合理存储和快速查询的要求. 对于同样的查询条件,在
近来许多应用领域如股票数据、网络流量监控,点击流、传感器网络、电话记录等领域中需要处理数据流问题,所以数据流的问题越来越引起人们的关注.而频繁模式的发现通常又是其
同关系数据库相似,XML数据的冗余也会引起更新异常.而由于Internet的开放性,XML数据更新异常的危害性远远大于关系数据.因此,对引起XML数据更新异常的原因及消除更新异常的方
随着企业电子商务的飞速发展,XML文档渐渐成为电子商务中数据传输的主要载体.而目前,出于XML文档的解析困难、管理不方便等各方面的原因,大多数企业的数据都采用关系数据库的
近来,XML已经成为Web上信息发布和信息交换的事实标准.许多数据源输出XML格式的数据,并发布相应的DTD或Schema.因此,无论数据是以XML文档的形式存储,还是存储在关系数据库,呈
目的:对乳腺癌保乳术后设计不同的照射技术进行剂量学分析研究. 材料方法:选用15例乳腺癌保乳术后病例,使用PHILIPS公司ADAC7.6c版本的三维逆向治疗计划系统,用siemens pr
1998年2月,万维网协会(W3C)推出了可扩展的标记语言XML(eXtensible Markup Language)作为Web上进行半结构化数据传输与交换的标准.随着XML的出现,XML数据相关技术研究成为热