论文部分内容阅读
计算机技术和企业信息化的发展,使得许多企业使用了大量的软硬件平台各异的应用系统,并在应用系统中积累了丰富的数据资源,形成了大量的难以实现共享与互操作的分布式异构信息源。实现企业信息系统中信息集成对于企业信息化而言具有重要的意义,现有的集成方法与技术大多不支持语义级别上的集成,难于完全满足企业信息系统集成需求。将语义Web和本体技术引入到系统集成中,对异构信息进行形式化和规范化表示,可以解决传统信息集成中存在的语法和语义异构问题。本文对基于语义的企业信息系统集成理论与方法进行了研究,并构建了一个语义集成原型系统。
论文在借鉴国外现有的企业信息系统集成应用理论的基础上,结合语义Web和本体技术的最新研究成果,对中文环境下企业信息系统集成的关键问题展开了研究和探讨,本文的主要研究内容如下:
(1)语义集成系统的体系结构设计及语义知识建模研究。语义集成系统体系结构主要由局部查询web service接口和语义集成中心两个主要部分构成,局部查询的Web service接口作为分布式系统的代理,提交本身和局部数据库的关系模式给集成中心,语义集成中心的负责实现局部本体生成与规范、全局-局部本体的映射和语义查询。在语义映射结果的基础上,将用户查询进行语义重写并发送给局部查询的web service接口以接收局部查询结果,最后对结果进行聚合并返回给用户。语义知识建模主要包括面向企业信息系统集成的领域语义词典构建和全局本体构建。
(2)基于关系数据库的局部本体学习研究。主要研究了从局部企业信息系统的关系数据库中抽取局部本体的方法,它包括两个初始局部本体生成和局部本体规范化两个阶段。初始局部本体生成主要根据定义的映射规则将关系数据库模式转换为本体中的概念、属性及关系等。局部本体规范化主要是对初始局部本体进行标准化处理,以提高局部本体的可用性。
(3)全局-局部本体的多策略本体映射研究。全局本体与局部本体的映射是基于语义的企业信息系统集成的关键。主要研究了基于相似度的全局-局部本体映射模型和多策略相似度计算方法。全局-局部本体映射模型定义了本体映射流程,该模型能够支持本体概念的映射,属性的一对一和一对多映射。多策略相似度计算方法克服了现有单一本体映射方法的不足,充分利用了本体概念定义、属性、结构及语义词典等信息进行相似度的计算,能够较有效地提高本体映射精度。
(4)基于语义的企业信息查询重写与聚合研究。主要研究了基于本体的语义信息查询的原理和方法,并提出了语义查询系统的设计,流程和语义查询重写,包括基于SPARQL的全局本体查询,基于本体映射的局部本体查询,和局部查询SQL语句构造。最后提出了一种基于相似度计算的查询结果消重。