资源融合网格环境中数据访问关键技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:coldblast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网格中存在各种类型的数据资源,这些数据资源物理上分布在异构环境中,有不同的数据格式、存储方式、访问控制策略,逻辑上则可能在数据模型、操纵语言和数据语义等方面存在着很大差异,导致不同应用系统之间、不同的信息拥有者之间无法相互理解对方的信息,形成了”信息异构”;信息异构主要包括结构、语法、系统以及语义层次的异构。在网格这种主要面向高级资源共享与协作的环境,信息异构的解决显得更为重要与困难;这中间,语义层面上的数据集成是首要问题。目前的异构信息集成方法已经能解决异构信息在结构、语法和系统层次上的异构,但对数据源在语义层次上的异构如何解决还存在问题和不足。本文旨在深入研究面向网格环境的语义数据集成问题,使应用程序能理解数据的语义以及数据与数据之间的关系,并提供具有语义支持、服务质量保障的数据访问,以实现资源融合网格中数据资源在语义层次上的融合。本文首先对网格环境中数据访问的研究现状和发展趋势进行了深入分析和探讨,之后提出了基于本体的语义数据集成模型ODSF,围绕ODSF中的几个关键问题如本体映射、具有OoS支持的数据访问、多连接查询优化等进行了研究,开发了基于ODSF的原型系统,该系统能够提供对网格环境中数据资源的透明访问。本文取得的主要创新点如下: (1)提出了基于本体的语义数据集成模型(ODSF)并引入了虚拟数据库的概念。ODSF中的基本元素是数据对象,使用嵌套关系来描述数据对象的数据模式,通过数据对象和领域本体之间的映射关系来表达数据对象的语义,通过语义标注来表达数据对象(元素)的上下文环境,通过定义虚拟数据库的QoS指标和业务规则来满足用户的QoS要求;可以提供网格环境下具有语义支持、QoS支持的数据访问服务,实现资源融合网格中自底向上、由粗到细的数据融合。 (2)提出了基于领域学习的本体映射方法,该方法利用多种策略(名称、结构、实例、元数据)计算元素之间的相似性,使用stacking算法来合并各种策略的计算结果,并利用领域知识来优化映射发现过程。实验结果证明了该算法的有效性。 (3)查询重写方面,提出了基于本体映射的查询重写算法,可有效改善查询重写过程。 (4)查询优化方面,提出了基于管道并行方式的分层管道树,利用遗传编程来确定分层管道树的形状,并在优化过程中考虑了用户的QoS要求,实验证明该方法是有效的。
其他文献
随着市场竞争的越来越激烈,商业环境中的信息越来越密集,未来企业之间的竞争主要是综合智能上的竞争,必须提高企业经营活动中的智能水平。传统的操作型信息管理系统已经难以满足
网格是利用互联网把地理上广泛分布的各种资源(包括计算资源、存储资源、带宽资源、软件资源、数据资源、信息资源、知识资源等)连成一个逻辑整体,就像一台超级计算机一样,为用
软件质量问题由来已久,软件测试是在软件开发过程中保证软件质量的一项重要活动。在软件测试中,先要根据需求确定测试的目标。再根据测试目标来构造测试用例。这组测试用例的数
支持向量机建立在统计学习理论基础上,应用VC维理论和结构风险最小化原理,借助于最优化方法等,在很大程度上克服了传统机器学习面临的维数灾难,局部最小点以及过学习等难以克服的
功能基因组学和蛋白质组学之后,现代分子生物学的一个新的门类RNA组学(RNAomics)正在逐步形成和发展壮大。近二十年来,生命科学中核糖核酸(Ribonucleic Acid,RNA)研究领域取得了
本文依托于中科院沈阳自动化研究所自动化装备研究室的项目——PASSIM卷接机组改造。PASSIM卷接机组是从英国MOLINS公司引进的设备,限于当时的硬件设计技术、芯片封装技术和通
二十一世纪数字化浪潮正在席卷全球。多媒体应用的深入和发展对图像压缩性能、处理灵活性等方面提出了进一步的要求,要求开发出复杂度低、速度快、压缩比高和扩展性好的图像压
目前,大多数商业系统通常都采用面向对象与关系数据库相结合的方式,这会引出对象模型和关系模型之间的不匹配问题。对象模型基于耦合、内聚和封装等软件工程的概念,而关系模型则
随着互联网的普及,互联网上的信息越来越多,为人们提供了丰富的信息资源。然而,人们却很难在杂乱无章的网络中快速、准确地获得自己想要的信息。虽然现在互联网上有很多搜索引擎
建立测井资料数据库,能够对测井数据进行科学有效的管理和利用,满足多井综合分析解释、盆地综合分析、油藏描述的需要,从而对油气臧参数的平面及空间分布规律进行研究,为油田的进