【摘 要】
:
本文提出了一种构造结构库的方法,它把基于链接值的聚类算法成功地应用到XML文档的结构信息上.从实验的结果来看,此方法不仅是可行的,也是有效的。
【机 构】
:
复旦大学计算机科学与工程系,上海,200433
论文部分内容阅读
本文提出了一种构造结构库的方法,它把基于链接值的聚类算法成功地应用到XML文档的结构信息上.从实验的结果来看,此方法不仅是可行的,也是有效的。
其他文献
Wrapper是Web数据集成的重要组成部分,然而众多的Wrapper生成方法都面临着维护的问题,因为Web页面经常发生变化,Wrapper的维护成为一项很难解决的问题.人们研究快速有效地自
Peer-to-Peer(P2P)技术也被称为Peer计算,是当前最有潜力的网络技术之一.这种技术去除了集中式服务器,使节点之间可以直接交换资源和服务.同时,任何一个节点可以自由地加入和
本文使用语义近似度分析了集成信息的GV中数据项的语义原子性与关系数据源中数据项的结构原子性之间的各种映射关系,阐述了二者不一致性的产生原因以及解决途径,对集成信息的产
本文提出了一种自动从XML数据文件抽取其数据模式的算法。从实验结果和理论分析两个方面与Lore系统(斯坦福大学的XML数据库系统)中的DataGuides相比,表明本算法有更高的效率.
随着Internet技术的迅速发展和日益成熟,人们积聚了越来越多的半结构化数据,如HTML,SGML,XML等文件。本文研究了半结构化数据中模式的交互式开采问题并且给出了相应的开采算法,
搜索引擎(SearchEngine)本质上是一种基于排序的因特网信息检索系统.它们接受用户的查询条件,计算文档与查询的相关性,以此为根据对文档集合进行排序,从中选取相关性超过特定
近年来,随着无线通讯技术及全球定位技术的发展,移动对象数据库(MovingObjectsDatabase,简称MOD)技术已经成为了一个研究热点,并在诸多应用领域中展现了广阔的应用前景,如智
以γ-Al2O3为载体,采用浸渍煅烧法制备了Fe2O3-MnO2/γ-Al2O3异相催化剂,利用BET和XRD技术对催化剂的表面结构性质进行了表征.以苋菜红水溶液模拟偶氮染料废水,考察了催化剂
目前,XML已经成为基于互联网的信息系统的最重要的基础性语言,而开发这样的系统的第一步是设计XML模式(或DTD).目前在复杂对象模式和XML模式规范化设计方面开展的研究不多,在
Peer-to-Peer(P2P)是一种新兴的分布式技术,当前主要应用于文件共享、网络协同计算、实时信息传递等领域.P2P技术为连接在Internet上的大量计算机共享自身的CPU计算能力、存