论文部分内容阅读
XML(eXtensible Markup Language)作为网络数据交换和表示的一种标准,越来越受到人们的青睐,然而,随着在网络上发布的XML数据的不断增加,如何管理XML文档已经成了一个十分棘手的问题。目前的研究侧重于用关系数据库来存储XML文档,但是由于XML数据和关系型数据在组织上的差异,以及关系数据库存储过程中存在XML文档的多值元素、嵌套元素以及混合元素地映射等难点问题一直没有得到有效的解决。所以研究XML数据在关系数据库中的存储成为XML研究的一个热点。本文主要研究XML文档在关系数据库中的存储问题。作者通过对XML Schema的基本语义进行分析,首先引入一个基于R_Schema(Reforming XML Schema)的XML文档存储方法,R_Schema由XML Schema生成,是XML Schema的一种等价形式;其次引入分级节点的概念,分级节点可以直接映射为关系,用表Ancestor存储嵌套的分级节点父子关系,然后引入一组改写规则对R_Schema进行改写,利用搜索算法进行优化处理,得到代价最小的R_Schema;最后实验证明,R_Schema方法在XML数据存储过程中的信息保持、查询和更新等操作优于文本、Xparent方法。总之,从理论分析和实验对比上可以表明,本文引入的基于R_Schema的XML文档存储方法是有效的。