在模式演化下Deep Web信息集成关键技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:greenecho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展和信息化的推进,Web上的信息在不断增加和深化,按其所蕴含信息的深度可以被划分为浅网(Surface Web)和深网(Deep Web)两类。相对于Surface Web,Deep Web中的信息具有质量高、体量大、增长快、领域性强等优点。为此构建一个Deep Web信息集成系统来高效地抽取和挖掘DeepWeb信息,一直以来都是Deep Web信息集成领域研究的热点。  本文首先对Deep Web信息集成系统的基本框架以及关键的技术进行了研究和介绍,并基于Deep Web信息集成的研究现状,分析了在模式演化下已有的Deep Web信息集成系统中存在的主要问题。然后,在此基础之上借鉴已有研究成果,对信息集成系统中的接口集成和查询处理两方面进行了较为详细的研究,具体的研究内容如下:  1.模式演化导致本地大量查询接口信息发生变动和失效,从而使得传统的接口集成方法所获得的全局查询接口的查询能力下降或不稳定,为此,提出了一种基于演化版本的Deep Web查询接口维护方法以及集成框架。首先,提取出反映Deep Web查询接口查询能力的特征信息,包括入口信息和模式信息,并将其构成二元组表示查询模型。其次,引入时间参数来表示不同时刻的查询模型版本,并用查询属性图刻画查询模型的不同版本的演化过程。然后,通过对查询属性图的游历分析,提取出查询模型中变化比较活跃的属性集,以此来构建最优查询路径,并进一步生成最优查询语句。接着,通过发起最优查询语句以最小的代价抽取出查询模型在深网中的变动信息,据此更新本地的当前版本信息,演化出下一个版本,实现对本地查询接口的信息维护。最后,将该方法应用在传统的集成系统中,提出了一个基于演化版本的Deep Web信息集成框架(简称EVIS框架),并通过实验验证了该方法在提高集成系统查询能力方面的有效性。  2.模式演化以及本地查询接口信息的维护将导致已有的模式映射关系发生变动,从而使得已有失效映射检测和重构映射关系的处理方法的效率以及查询转换的准确率不高,为此,提出了一个基于映射权重的查询接口选择方法以及集成框架。首先,采用三个匹配器来进行查询接口属性的模式匹配。然后,通过基于相似度矩阵的属性聚类构建全局属性与成员属性之间的映射关系。接着,从全局属性与成员属性之间的映射关系中提取出映射权重,来实现最终多个本地查询接口的选择,达到基于动态映射关系的全局查询请求转发的目的,实验结果表明该方法提高了查询接口转换的准确率,降低了Deep Web网络环境变化对查询处理的影响。最后,在EVIS框架的基础上提出了一个基于映射权重的Deep Web信息集成框架(简称MWIS框架),实验结果表明MWIS框架进一步提高了集成系统的查询能力。
其他文献
进程代数作为描述和分析并发与分布式系统的重要工具之一,是并发理论的主流研究方向。互模拟是进程代数的核心概念之一,用来刻画进程之间的等价关系,其中描述观察等效的弱互
P2P计算在进一步利用因特网信息和资源方面已经成为一个流行的模型,Web服务代表了分布式计算的下一个阶段,构建基于面向服务的架构(SOA)的应用是未来分布式计算的发展方向。
为了满足无线通信用户的需求,提高服务质量,国内外许多研究工作者都在致力于研究如何降低切换延迟来保证通信质量。 本文参阅了大量国内外关于切换延迟方面的参考义献,介绍了
IPSec、NAT、NAT-PT和防火墙在特定的应用领域都是不可缺少的。IPSec保障了IP包在传输过程中的安全性,能够为IP包提供数据源认证、完整性保护、加密性和抗重放攻击等安全服务
在分布式协作开发环境中进行系统设计工作时,要求不同的设计工具之间能够相互衔接与协作,从而使得设计任务的流程能够平滑相连。使用Web服务技术,将工具的功能包装为服务,并
现如今是信息爆炸和资源共享的时代,随着虚拟现实技术的快速发展,传统博物馆展示设计理念早已无法满足时代的要求,由此虚拟博物馆应运而生。虚拟博物馆作为博物馆建设进程中的重
无线局域网技术使得网络的接入方式不再受物理线路的局限;嵌入式技术使得通信设备向着微型化、低功耗和高性能的方向发展。地铁移动WLAN系统正是无线局域网与嵌入式技术集成
随着软件系统的日益复杂,软件开发、维护以及进化的大部分工作和主要成本集中在对现有系统的理解上。逆向工程是一种辅助程序理解的重要手段,是软件工程的一个重要分支,它通
一直以来,主分量分析(PCA)是一个倍受国内外学者关注的科研课题,它能找到一种可逆的正交变换,使原有的高维数据投影到较低维的数据空间中,并保留数据的主要特征。目前PCA已经
随着信息管理系统的深入研究和发展,其应用领域和管理范围被不断拓宽,多种多样的应用需求不断对信息管理提出新的挑战。具有独特的数据结构和信息管理需求的各种特定应用领域,提