一种XML数据流查询过滤算法

来源 :山西大学 | 被引量 : 3次 | 上传用户:fchbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,XML数据流的查询处理引起了国内外学者的广泛兴趣。如何在XML数据流中有效地查询大量XPath表达式是当今研究的一个热点问题。目前,已经提出很多种在XML文档上进行XPath查询的方法,其中大部分是采用基于自动机的查询方法,它又可分为基于不确定有穷自动机(NonDeterministic Finite Automata)和基于确定有穷自动机(Deterministic Finite Automata)两种。除此之外,还有基于索引的以及基于谓词的查询方法。对于NFA中的一个状态,同一个输入下可能发生很多个状态转移,为了查找下一个指定的状态需要花费很长的时间。然而对于DFA中的一个状态而言,同一个输入下发生了确定的状态转移,但是随着XPath查询表达式数目的增加,自动机的状态数会迅速增加,这样需要占用很多的存储空间。本文对XML数据流查询处理中所存在的问题进行了比较详尽的研究,针对目前存在的XML文档处理方法的不足,构建了一种索引结构,在索引结构的基础上又提出了一种查询算法。本文的主要工作如下:(1)构建了一种新颖的索引机制---XML文档的索引结构。首先从给定的XML文档中提取出文档结构,然后根据文档结构建立一个个索引节点,组成文档的索引结构。(2)利用所构造的文档的索引结构,对给定的一系列XPath查询表达式进行预处理。将与索引节点匹配的查询表达式标注于对应索引节点的谓词列表框内。(3)提出了一种解决线性路径查询的算法LXPF。(4)通过实验将本文提出的算法跟以往所提出的算法进行比较,结果表明其有效性。
其他文献
随着计算机网络、数据库、多媒体等技术的飞速发展和日益普及,越来越多的应用系统产生了海量的流式数据。这些流式数据中包含着大量的信息和知识,因此对基于流式数据的联机多维
21世纪随着信息时代的飞速发展,带来的变化也日新月异,随之而来将是愈发激烈的竞争。谋生存,求发展,将是每个企业必须关注的长久大计。一方面在这个激烈的竞争过程中,技术的更新与
学位
支持向量机基于结构风险最小化,是由Vapnik等人在统计学习理论基础上提出来的。由于SVM具有很好的泛化性能和推广能力,能够较好的解决小样本、高维数、非线性以及大规模的实
随着科学技术及国民经济的发展,各行各业对高精度高稳定性时间同步系统的需求日益增长,在目前作为我国基础行业(通信、电力和交通)的高速发展中更显突出。我国现有的授时手段
学位
光谱仪器和光谱分析技术在国防、生物医学、环境科学等方面有着广泛的应用。本文通过分析光谱仪的一般原理和结构,并依据各种光学原理,成功实现了一种依靠NMOS线阵图像传感器
学位
几年前,我们对“游戏引擎”或"Game Engine"这一词还十分陌生,如今,任何一个游戏开发人员都应该非常了解游戏引擎,甚至迮游戏玩家说出这个词的频率也与日俱增。这种转变除了要归
学位
地质体三维可视化(Three-dimension Geologic Body Visualization)研究作为科学计算化的核心已经成为当今研究的前沿课题之一,为深入了解地下矿体结构提供了有效解决方法。地
学位
软件漏洞是软件安全性问题的重要表现。随着系统和软件的复杂度提高和应用场景的扩展,软件漏洞呈现出数量多、影响广、危害大的趋势。针对软件漏洞的研究一直是工业界和学术界
随着通信和其他业务的不断扩展,各种交易渠道也不断增加,同时,业务的增加也带来了更多的业务处理系统,各系统向数据共享也增加,本设计就是为了改变目前多渠道、多系统之间的
随着地理信息技术的发展,地理信息系统(Geography Information System,简称GIS)的应用已渗透到各个领域,特别是Google公司在2005年推出谷歌地图产品后,给了人们以直观的GIS体
学位