论文部分内容阅读
随着互联网、信息技术和数据库技术的飞速发展,各大公司和企业纷纷建立了各自的IT信息集成系统,由此积累了大量异构数据,如何高效便捷的处理这些数据信息成为企业信息化进程中的问题之一。因此,对异构数据集成系统的研究已经成为当今业界和学术界的研究热点。本论文从造成数据异构问题的根源出发,利用目前流行且很实用的Web服务和中间件技术,实现了对关系型异构数据库的集成。并将其应用于实际项目中,对新增添系统数据库的实际集成,取得了很好的集成效果。首先介绍了异构数据集成的研究背景、国内外研究现状以及目前异构集成所面临的问题;其次,研究并分析了现有的数据集成方法的优缺点,结合现状和实际需求,采用Mediator/Wrapper体系结构进行异构数据集成系统的设计和开发。重点讨论了Mediator/Wrapper方法中的两大组件Mediator和Wrapper。Mediator的设计和开发采用了分布式技术,这种松散的架构方式降低了业务系统对Mediator的依赖以及Mediator对Wrapper系统的依赖,提高了系统整体的可扩展性和稳定性; Wrapper不同于传统的Wrapper,每个Wrapper均是独立部署在不同的物理节点之上,通过调用Web Service与Mediator建立通信。其中,查询处理是数据集成系统的研究重点之一,主要涉及到查询语言的设计与转化、查询分解、查询优化等。参照SQL语言和XQuery等查询语言,并结合分布式系统的实际情况,设计了Minisql作为中间查询语言,小巧灵活、功能强大,可以适配多种数据源,从而进行跨语言处理,很好的解决了模式映射和语言解析问题。最后,将该集成系统应用于数字图书馆数据平台中,很好的验证了基于Web服务数据集成系统的正确性和可行性。