基于XML的数据集成技术的研究与应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:blueteen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据集成是运用一定的技术手段将分布、自治、异构的多个局部数据源中的数据按一定规则组织成为一个有机整体的过程。数据集成是一种现实需求,用户需要通过数据集成获得一个一致的、便于访问的数据集合。数据集成方法可以分为数据转换方法、数据仓库方法和数据联邦方法三类。数据转换方法通过转换工具将一个数据库中的数据复制、转换为另一个数据库中的数据。数据仓库方法通过对异构数据源中的数据进行分析、转换和装载,从而实现数据的集中存储和访问。数据联邦方法通过建立对分布数据源的联邦访问实现数据集成。 XML是W3C推荐的一种元标记语言规范。将扩展性强、可自描述、标准化的XML运用于数据集成领域就形成了基于XML的数据集成方法。基于XML的数据集成方法是对传统数据集成方法的改进。它的最大特点是集成过程中数据流的标准化。 本文提出了一种适合在企业范围内建立全局应用的基于XML的数据集成系统框架XDIFrame(XML-basedDataIntegrationFramework),它结合了数据仓库方法和数据联邦方法的优点,从原始数据源抽取数据建立XML存储库进行数据发布,并在此基础上建立全局联邦查询。 同时,本文提出了一种独立于具体数据库管理系统的基于XTemplate模板的XML查询方法。基于模板的XML查询是从结构化数据源获取XML数据常用的一种方法。但是,各数据库管理系统提供的基于模板的XML查询语言语法各异,访问多个异构数据源时需要按照各自语法设计多个模板文件。本文提出的基于XTemplate模板的XML查询方法独立于具体的数据库管理系统,查询不同的异构数据源时可以使用语法统一的模板文件。更重要的是,还可以为没有内置XML查询支持的结构化数据源提供对XML查询的支持能力。 最后,本文介绍了审判数据集成系统实现过程中包括审判标记语言的定义、XML包装器的实现和查询中间件的建立等关键技术。审判数据集成系统的主要任务是对江苏全省范围内的法院综合信息系统中各种数据进行集成。该系统基于案件信息和公文信息等主题建立XML存储库,并在此基础上建立全省范围内的虚拟数据集合以满足查询、统计、分析等数据处理需求。
其他文献
基于内容的图像检索技术(CBIR),是计算机视觉领域的一个研究热点。传统的基于内容的图像检索方法,提取图像的颜色、形状和纹理等底层特征来建立索引,并进行图像检索。但是,这种基于
多示例学习起源于对药物活性预测问题的研究,由于其具有独特的性质和广泛的适用性,目前被认为是与监督学习、非监督学习以及强化学习并列的一种新型机器学习框架。本文针对多示
无线数控手持设备采用工业级无线通信技术取代线缆,具有低成本、易扩展、移动灵活、操作简便等传统有线手持设备无可比拟的诸多优势。ZigBee技术,不同于传统的红外、蓝牙,是专门
装备操作训练是部队院校的一项重要教学任务,长期以来受实装数量的制约,装备操作训练如何实施的问题一直没有从根本上解决,尤其是新装备,院校装备少,甚至没有实装。采用模拟器解决
随着计算机技术和网络技术的发展和应用,推行金融办公自动化以提高管理透明度和管理效率已成为当前我国金融领域的一项重要工作。江苏省农村信用社目前各项业务发展非常迅速,但
随着电子商务和电子政务的推广和深入,工作流技术已成为该领域的主流技术,工作流管理的主要目标是通过调用有关的信息资源和人力资源来协调业务过程中的各个环节,使之按照一
Web服务,作为现有技术的革新(而非革命)无疑成为目前应用环境中最为科学、合理的解决方案之一.但就其本质而言,Web服务实际上还是request-respond的被动形式,随着网络智能化
野外地质场景的多媒体信息资源对于地质科学的研究和学习,是非常宝贵的参考资料.其中那些经过时间、空间的变化,自然的或人为的破坏,而使得有些地质资源不复存在的地质场景的
作为支持过程建模、优化分析,经营过程自动化的有效支持工具,工作流(Workflow)管理技术在近年来得到了广泛的重视,并逐步成为研究的热点.迄今为止,在工作流管理领域还没有一
该文工作的主要背景是中国科学院"十五"信息化建设重大项目——科学数据库及其应用系统.科学数据库经过近二十年的发展,数据资源的规模和深度不断扩展,在数据规范和管理等方