论文部分内容阅读
数据整合是实现信息资源共享的有效途径之一。它为数据挖掘、知识发现以及应用开发提供透明的数据访问服务,从而有效地利用现有资源,为科技进步与创新奠定坚实的基础。现有的信息资源存储于各种不同的数据库、结构化或半结构化文件中,因此,在构建数据整合系统时会面对许多方面的问题,主要是异构性、完整性、结构冲突和语义冲突等。虚拟数据库技术致力于实现网络信息资源的共享与统一访问。使得外部数据源成为企业的关系数据库系统的外延。它收集、组织并集成分布于网络的分散数据,为上层应用程序提供单一、规范的关系数据库的数据形式。本文结合虚拟数据库技术与当代大型数据库管理系统的特点,将虚拟数据库的技术应用到数据整合系统中,实现了异构数据源元数据的集中管理和多数据源间的数据共享。通过中间件与Web Service技术实现信息资源的整合与共享。本文提出的体系结构根据领域划分知识,建立主题知识元数据模型解决了语义冲突和结构冲突。系统中使用跨平台标记语言XML来描述信息资源模型。系统通过分类包装数据源,统一的数据源访问接口,实现了数据源的“即插即用”。系统实现使用跨平台JAVA语言,运行环境依赖于Java虚拟机,在操作系统中只要存在Java虚拟机便都可编辑、编译、调试和运行。数据服务的发布用Web Service标准框架,使得应用层的实现与中间件分离,从而使平台系统具有了良好的独立性、可移植性和跨平台性。本文以专家信息资源为研究对象,建立“山西省科技基础条件平台建设”项目的示范工程,实现专家信息资源共享,使资源得到有效利用与合理分布。论文着重研究系统的通用性和灵活性,主要以关系数据库为主要对象,讨论了关系数据库在实现数据整合过程中存在的一些问题。当代科学技术发展呈现出渗透、交叉与融合的态势,研究与开发的全球化趋势明显加快,信息技术的普遍应用正在深刻地改变着传统的科研方式与创新模式。科技资源的占有、配置、开发和利用方式的优劣,日益成为决定国家科技创新能力强弱的关键因素。因此研究数据整合系统的体系结构有很大的现实意义和经济效益。