论文部分内容阅读
随着网络和分布式应用的发展和普及,大量的异构数据源应运而生,为了最大程度地利用已有知识成果,人们迫切需要解决异构数据源带来的信息集成问题。因此,信息集成系统的主要任务是屏敞数据的半结构性、异构性和分布性,为用户提供统一的模式,实现异构数据源之间的信息交互和从异构数据源中获取有效的信息。
异构信息集成的巨大市场前景以及众多的技术难题,使得信息集成将在长期时间内持续成为研究的热点。本文讨论了当前的信息集成技术和实现方法,以及存在的问题,介绍了国内外相关领域的研究现状。通过对国内外主要信息集成项目的介绍可以看出,与国外涌现的研究项目和研究成果相比,国内关于信息集成的研究尚存在较大差距,并且目前传统的信息集成系统使用数据库集成、数据库模式和Mediator/Wrapper方法,实现了系统层面的信息集成,但缺乏对信息语法和语义层面的集成支撑。
本文通过对本体(Ontology)的基本理论和关键技术的研究基础上,认为本体能够有效地表达特定领域内的通用知识,可作为信息集成中的通用语义模型,能为信息集成中知识的表示、共享,以及查询处理与知识推理等关键问题提供有效的解决途径。而随着XML成为标准的信息交换格式,XML的特点使它在执行异构信息集成方面成为公共数据模式的最佳候选者,是解决信息集成中的结构异构问题的有效手段。
本文在总结分析国内外已有研究工作基础上,提出了基于XML Schema和本体的信息集成模型(Information Integration Model Based on XML schema and Ontology,XOIIM),重点研究了XIIOM模型的三大核心模块,主要研究工作和成果如下:
第一,在原有Mediator/Wrapper信息集成体系结构中引入XML Schema和本体技术,提出XOIIM集成模型,并阐述了它的核心组成部分和处理思想。
第二,在对多种典型数据类型特点分析的基础上,对XOIIM模型的模式映射模块进行了深入研究,提出了查询结果的局部模式与XML Schema公共数据模式,和XQuery全局语言和子查询语言进行模式转换的映射规则,并进行了相应的实例分析。
第三,在物流企业本体建模的实证研究中,认为一个企业的本体论可分为企业通用本体和行业领域本体两部分。在这一研究思路下,以物流行业标准术语、供应链管理参考模型SCOR,以及Enterprise Ontology为基础,采用protégé2000作为本体构建工具,借鉴混合本体架构思想,建立了物流企业本体的顶级概念模型和物流活动的本体实例。
第四,在研究描述逻辑向谓词逻辑转换和谓词逻辑的推理规则基础上,详细论述了基于本体推理的全局查询式扩展方法。并使用XQuery表示全局查询语言,以物流企业本体中的物流活动领域为例,在构建的客户管理和配送管理本体实例基础上,实践了XOIIM模型中的语义查询处理。从产生全局查询语句开始,根据本体推理结果分解语句为子查询,然后再将各子查询转化为针对各局部数据源能直接执行的查询语句,最后将查询结果用XML文档的格式返回。
本文认为在一定程度上,XOIIM模型为信息集成中的数据源语义异构和结构异构问题的解决提供了一个参考方案。