一种压缩XML数据仓库的存储策略

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:bergkampsisi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于PCG存储的压缩XML数据仓库的存储策略,这种方法适合于大量的可能具有较相近内容的XML形式的文档,比如历史数据,从Web上提取的数据。方法的核心是将文档根据其编辑距离进行聚类,对每一个聚类中按照“中心十其他文档到中心的变化”的方式进行存储,本文还研究了在这种逻辑的存储模型下的物理存储策略以及数据管理的方法.
其他文献
本文使用语义近似度分析了集成信息的GV中数据项的语义原子性与关系数据源中数据项的结构原子性之间的各种映射关系,阐述了二者不一致性的产生原因以及解决途径,对集成信息的产
本文提出了一种自动从XML数据文件抽取其数据模式的算法。从实验结果和理论分析两个方面与Lore系统(斯坦福大学的XML数据库系统)中的DataGuides相比,表明本算法有更高的效率.
随着Internet技术的迅速发展和日益成熟,人们积聚了越来越多的半结构化数据,如HTML,SGML,XML等文件。本文研究了半结构化数据中模式的交互式开采问题并且给出了相应的开采算法,
搜索引擎(SearchEngine)本质上是一种基于排序的因特网信息检索系统.它们接受用户的查询条件,计算文档与查询的相关性,以此为根据对文档集合进行排序,从中选取相关性超过特定
会议
近年来,随着无线通讯技术及全球定位技术的发展,移动对象数据库(MovingObjectsDatabase,简称MOD)技术已经成为了一个研究热点,并在诸多应用领域中展现了广阔的应用前景,如智
会议
以γ-Al2O3为载体,采用浸渍煅烧法制备了Fe2O3-MnO2/γ-Al2O3异相催化剂,利用BET和XRD技术对催化剂的表面结构性质进行了表征.以苋菜红水溶液模拟偶氮染料废水,考察了催化剂
目前,XML已经成为基于互联网的信息系统的最重要的基础性语言,而开发这样的系统的第一步是设计XML模式(或DTD).目前在复杂对象模式和XML模式规范化设计方面开展的研究不多,在
Peer-to-Peer(P2P)是一种新兴的分布式技术,当前主要应用于文件共享、网络协同计算、实时信息传递等领域.P2P技术为连接在Internet上的大量计算机共享自身的CPU计算能力、存
会议
本文提出了一种构造结构库的方法,它把基于链接值的聚类算法成功地应用到XML文档的结构信息上.从实验的结果来看,此方法不仅是可行的,也是有效的。
随着计算机软硬件技术与网络技术的发展,信息收集、资料汇总等工作越来越多地在网络上完成,它们从客户端收集特定格式的信息,传输到服务器,并存储到数据库.本文针对证券信息披露
会议