论文部分内容阅读
摘 要 介绍高校信息化的现状,对信息化进行中出现的信息孤岛问题进行分析,给出解决信息孤岛、实现数据共享的方法,即采用XML技术对异构系统数据进行集成,利用XML技术实现数据交换。
关键词 XML;信息共享;数据集成;数据交换
中图分类号 G434 文献标识码 A 文章编号 1671-489X(2008)18-0040-03
1 高校信息化现状
信息技术的空前发展,已对社会的经济、文化、教育等产生深远影响,导致新的教育技术革命。《2003—2007年教育振兴行动计划》明确提出实施“教育信息化建设工程”,要求加强高等学校校园网建设,加大教育信息资源开发,推动高等学校数字化校园建设,推动网络资源的整合。
随着中国教育科研计算机网(CERNET)的建成和不断发展,各高等院校纷纷建设校园网。基于校园网的应用系统的开发,也就成为有关软件开发商及高等院校师生关注的一个热点。高校校园管理信息系统是学校教学、科研和行政管理工作中一项非常重要的基础建设。由于高校内各单位各部门信息化进程不一,开发工具和平台也差别很大,在开发时缺少统筹协调,特别是早期网络不太完善时开发的系统,甚至根本没有考虑过数据共享的问题,形成一个个的信息孤岛。这一类系统使用时间长,数据量大,数据迁移成本高。在统一实现校园信息化过程中,如何利用现有系统数据并实现信息系统之间数据共享,对节省开发费用、提高系统运行效率和性能,进而提高管理水平具有十分重要的意义。
2 异构数据库概述
异构数据库是指结构相异的数据库,这里的异构有两个级别含义:系统级的异构和语义级的异构。
系统级的异构主要表现在数据源所依赖的运行环境不同和各数据库管理系统(DBMS)的不同。具体表现:1)计算机体系结构的异构,各个参与集成的数据库系统可以分别运行在大型机、小型机、工作站、PC 或嵌入式系统中;2)网络体系结构的异构,各个数据库系统运行在不同的网络环境中,例如运行在广域网中的数据库系统和运行在局域网中的数据库系统等;3)基础操作系统的异构,各个数据库系统的基础操作系统可以是UNIX、WINDOWS、LINUX等;4)DBMS本身的异构,可以同为关系型数据库管理系统的Oracle、SQL Server等,也可以是不同数据模型的数据库管理系统。
语义级的异构主要源于不同数据库对相同或相关数据的理解、解释及使用的不一致性。比如在两个数据库中,对同一个属性名的具体含义定义不同,或对同一属性的数据值在两个数据库中的精度定义不同,都可能引起语义差异。一个显著的差异便是各个关系型DBMS在数据类型上并不完全一致,在集成时必须进行一定的转换。
3 XML技术[3]
可扩展标示语言XML (Extensible Markup Language) 是由W3C(World Wide Web Consortium,互联网联合组织)于1998年2月发布的一种标准,是从标准通用标记语言SGML(Standard Generalized Markup Language,标准通用标记语言)派生出来的,XML继承了SGML可扩展性和文件自我描述特性以及强大的文件结构化功能,但摒弃了SGML过于庞大复杂和不易普及化的缺点。XML有如下突出特点:
1)可扩展性。XML不关心信息如何显示,只是提供数据及其结构的信息,允许各个不同的行业根据自己独特的需要制定自己的一套标记。
2)显示多样化。XML通过可扩展样式表语(XSL)、可扩展样式表语言转换(XSLT)等设计高级用户接口,以实现文件的内容与显示分开,实现显示多样化。
3)自描述性。通过文档类型定义(DTD)或概要(schema)对XML文件格式进行正确的定义,这样就使得XML具有良好的自描述性,能够描述信息本身的含义甚至它们之间的关系。
4)平台独立性。XML以文本格式存储和传输,便于用作各种不同系统之间的交流媒介,是一种跨平台的语言。
5)互操作性。XML支持用于字符编码的多种主要标准。
4 XML与异构系统
XML为异构系统的信息交换提供了标准格式,为异构数据库的互操作提供了前提。在学校建立以学生数据为中心的一个数据集成系统,将为各业务信息系统提供一致的、稳定的共享数据源。集成数据系统既能保证全局数据的共享,又能保证学校各部门应用系统及其数据库管理系统的自治,确保基于异种系统平台实现对异构数据库的查询和联合使用,提供一个独立于特定数据库管理系统的统一数据使用界面。具体地讲,就是要将数据库管理系统的不同、操作系统的不同、计算机平台的不同或者底层网络的不同屏蔽掉,使得用户可以将异构数据库系统看成普通的数据库系统,用自己熟悉的数据处理语言去访问数据库,如同访问一个数据库一样,对其进行透明的操作。
5 利用XML实现数据信息集成的关键技术
5.1 XML文档以及XML架构的获取获得XML文档,通常有2种方法。1)当数据文件能够通过ADO.NET访问时,如后台数据库为SQL Server或者Oracle,并能够直接通过SQL查询,则可以利用.Net 架构中DataSet控件所提供的WriteXml()、WriteXmlSchema ()方法得到XML文档。2)当数据文件不能直接访问,只能通过COM组件或者API函数访问时,就需要按照XML规范,将从遗留系统中得到的原始数据写人XML文档。如果还需要获得XML架构的话,就需要利用.NET Framework提供的XML Schema/Datatype Support工具(Xsd.exe),根据上述XML文档生成相应的架构;不过通过这种方法得到的架构其字段属性均为String类型,需要参照具体的系统进行修改。
5.2 Web Service返回的XML文档形式对返回的XML通过Web服务外置时通常有2种方式:1)作为字符串返回;2)通过强类型转化,将XML文档强制转化为DataSet然后传输。由于需要对返回的数据进行分析、存储,而不再需要对字符串结构进行分析,这样就可以通过强类型化的代理直接访问XML字符串中的域,很方便地对Web服务返回的数据进行处理和应用。
5.3 将XML封装成Web Service[3]当获得XML文档后,只需要通过强类型转化即可将XML映射成和资源系统数据库中数据表一样的结构,以供Web应用程序以及其他企事业单位应用程序使用;在Web Service中添加一个Web方法即可外置XML文档。其方法如下:
[WebMethod]
public DataSet GetItemList ( )
{
DataSet ds = newDataSet();
ds.ReadXML(Server.MapPath (“ItemsXMLFile.xml”));
return ds ;
}
当通过集成平台的UDDI中心找到上述 Web服务并获得使用权,就可以在需要使用该数据的程序中引用该数据服务,并将相应的数据导人到对应的程序中。
6 数据交换[1]
6.1 XML设计数据访问接口
〈?xml version="1.0"encoding="GBK"?〉
〈DEPTS〉
〈!—部门组织字典—〉
〈DEPT〉
〈DEPT_NAME〉deptl〈/DEPT_NAME〉
〈DEPT_SHORTNAME〉d1〈/DEPT_SHORTNAME〉
〈DEPT_CODE〉codel〈/DEPT_CODE〉
〈DEPT_LEVEL〉1〈/DEPT_LEVEL〉
〈DEPT_PARENT〉dept0〈/DEPT_PARENT〉
〈/DEPT〉
〈DEPT〉
〈DEPT_NAME〉dept2〈/DEPT_NAME〉
〈DEPT_SHORTNAME〉d2〈/DEPT_SHORTNAME〉
〈DEPT_CODE〉code2〈/DEPT_CODE〉
〈DEPT_LEVEL〉2〈/DEPT_LEVEL〉
〈DEPT_PARENT〉dept0〈/DEPT_PARENT〉
〈/DEPT〉
〈/DEPTS〉
6.2 异构数据交换时,进行数据交换的双方服务器既是服务器又是客户端现假设部门1与部门2进行数据交换,这时可将部门1作为客户端,部门2作为服务端,其交换示意图如图1所示。具体的流程可以描述为:部门1通过调用SQL Server.NET或OLEDB.NET实现对数据库的访问,从部门1数据库中提取所需的数据,通过XML接口转换成XML数据文件,通过SOAP和HTTP协议,把XML数据文件发送给部门2;部门2利用XML接口和数据库接口[2],将接收的数据进行处理并存储到部门2数据库中。反之,部门2作为客户端,部门1作为服务端,流程相似。
7 小结
充分利用现有信息化资源,在已有的异构业务系统之间建立统一的信息交换平台,实现数据交换对高校网络协同办公具有特别重要的意义。利用XML技术实现异构数据的集成和数据交换,可以实现异构数据库之间的透明操作,在尽量节省费用、确保性能的前提下,较好地解决历史遗留的信息孤岛问题,实现数据的集成和共享。
参考文献
[1]张震,肖先勇.基于XML的电能质量标准数据共享模型及跨平台数据交换[J].计算机统应用,2007(27):12
[2]微软公司.面向.NET的WEB应用程序设计[M].北京:高等教育出版,2006
[3]微软公司.XML Web Service开发[M].北京:高等教育出版社,2004(10)
关键词 XML;信息共享;数据集成;数据交换
中图分类号 G434 文献标识码 A 文章编号 1671-489X(2008)18-0040-03
1 高校信息化现状
信息技术的空前发展,已对社会的经济、文化、教育等产生深远影响,导致新的教育技术革命。《2003—2007年教育振兴行动计划》明确提出实施“教育信息化建设工程”,要求加强高等学校校园网建设,加大教育信息资源开发,推动高等学校数字化校园建设,推动网络资源的整合。
随着中国教育科研计算机网(CERNET)的建成和不断发展,各高等院校纷纷建设校园网。基于校园网的应用系统的开发,也就成为有关软件开发商及高等院校师生关注的一个热点。高校校园管理信息系统是学校教学、科研和行政管理工作中一项非常重要的基础建设。由于高校内各单位各部门信息化进程不一,开发工具和平台也差别很大,在开发时缺少统筹协调,特别是早期网络不太完善时开发的系统,甚至根本没有考虑过数据共享的问题,形成一个个的信息孤岛。这一类系统使用时间长,数据量大,数据迁移成本高。在统一实现校园信息化过程中,如何利用现有系统数据并实现信息系统之间数据共享,对节省开发费用、提高系统运行效率和性能,进而提高管理水平具有十分重要的意义。
2 异构数据库概述
异构数据库是指结构相异的数据库,这里的异构有两个级别含义:系统级的异构和语义级的异构。
系统级的异构主要表现在数据源所依赖的运行环境不同和各数据库管理系统(DBMS)的不同。具体表现:1)计算机体系结构的异构,各个参与集成的数据库系统可以分别运行在大型机、小型机、工作站、PC 或嵌入式系统中;2)网络体系结构的异构,各个数据库系统运行在不同的网络环境中,例如运行在广域网中的数据库系统和运行在局域网中的数据库系统等;3)基础操作系统的异构,各个数据库系统的基础操作系统可以是UNIX、WINDOWS、LINUX等;4)DBMS本身的异构,可以同为关系型数据库管理系统的Oracle、SQL Server等,也可以是不同数据模型的数据库管理系统。
语义级的异构主要源于不同数据库对相同或相关数据的理解、解释及使用的不一致性。比如在两个数据库中,对同一个属性名的具体含义定义不同,或对同一属性的数据值在两个数据库中的精度定义不同,都可能引起语义差异。一个显著的差异便是各个关系型DBMS在数据类型上并不完全一致,在集成时必须进行一定的转换。
3 XML技术[3]
可扩展标示语言XML (Extensible Markup Language) 是由W3C(World Wide Web Consortium,互联网联合组织)于1998年2月发布的一种标准,是从标准通用标记语言SGML(Standard Generalized Markup Language,标准通用标记语言)派生出来的,XML继承了SGML可扩展性和文件自我描述特性以及强大的文件结构化功能,但摒弃了SGML过于庞大复杂和不易普及化的缺点。XML有如下突出特点:
1)可扩展性。XML不关心信息如何显示,只是提供数据及其结构的信息,允许各个不同的行业根据自己独特的需要制定自己的一套标记。
2)显示多样化。XML通过可扩展样式表语(XSL)、可扩展样式表语言转换(XSLT)等设计高级用户接口,以实现文件的内容与显示分开,实现显示多样化。
3)自描述性。通过文档类型定义(DTD)或概要(schema)对XML文件格式进行正确的定义,这样就使得XML具有良好的自描述性,能够描述信息本身的含义甚至它们之间的关系。
4)平台独立性。XML以文本格式存储和传输,便于用作各种不同系统之间的交流媒介,是一种跨平台的语言。
5)互操作性。XML支持用于字符编码的多种主要标准。
4 XML与异构系统
XML为异构系统的信息交换提供了标准格式,为异构数据库的互操作提供了前提。在学校建立以学生数据为中心的一个数据集成系统,将为各业务信息系统提供一致的、稳定的共享数据源。集成数据系统既能保证全局数据的共享,又能保证学校各部门应用系统及其数据库管理系统的自治,确保基于异种系统平台实现对异构数据库的查询和联合使用,提供一个独立于特定数据库管理系统的统一数据使用界面。具体地讲,就是要将数据库管理系统的不同、操作系统的不同、计算机平台的不同或者底层网络的不同屏蔽掉,使得用户可以将异构数据库系统看成普通的数据库系统,用自己熟悉的数据处理语言去访问数据库,如同访问一个数据库一样,对其进行透明的操作。
5 利用XML实现数据信息集成的关键技术
5.1 XML文档以及XML架构的获取获得XML文档,通常有2种方法。1)当数据文件能够通过ADO.NET访问时,如后台数据库为SQL Server或者Oracle,并能够直接通过SQL查询,则可以利用.Net 架构中DataSet控件所提供的WriteXml()、WriteXmlSchema ()方法得到XML文档。2)当数据文件不能直接访问,只能通过COM组件或者API函数访问时,就需要按照XML规范,将从遗留系统中得到的原始数据写人XML文档。如果还需要获得XML架构的话,就需要利用.NET Framework提供的XML Schema/Datatype Support工具(Xsd.exe),根据上述XML文档生成相应的架构;不过通过这种方法得到的架构其字段属性均为String类型,需要参照具体的系统进行修改。
5.2 Web Service返回的XML文档形式对返回的XML通过Web服务外置时通常有2种方式:1)作为字符串返回;2)通过强类型转化,将XML文档强制转化为DataSet然后传输。由于需要对返回的数据进行分析、存储,而不再需要对字符串结构进行分析,这样就可以通过强类型化的代理直接访问XML字符串中的域,很方便地对Web服务返回的数据进行处理和应用。
5.3 将XML封装成Web Service[3]当获得XML文档后,只需要通过强类型转化即可将XML映射成和资源系统数据库中数据表一样的结构,以供Web应用程序以及其他企事业单位应用程序使用;在Web Service中添加一个Web方法即可外置XML文档。其方法如下:
[WebMethod]
public DataSet GetItemList ( )
{
DataSet ds = newDataSet();
ds.ReadXML(Server.MapPath (“ItemsXMLFile.xml”));
return ds ;
}
当通过集成平台的UDDI中心找到上述 Web服务并获得使用权,就可以在需要使用该数据的程序中引用该数据服务,并将相应的数据导人到对应的程序中。
6 数据交换[1]
6.1 XML设计数据访问接口
〈?xml version="1.0"encoding="GBK"?〉
〈DEPTS〉
〈!—部门组织字典—〉
〈DEPT〉
〈DEPT_NAME〉deptl〈/DEPT_NAME〉
〈DEPT_SHORTNAME〉d1〈/DEPT_SHORTNAME〉
〈DEPT_CODE〉codel〈/DEPT_CODE〉
〈DEPT_LEVEL〉1〈/DEPT_LEVEL〉
〈DEPT_PARENT〉dept0〈/DEPT_PARENT〉
〈/DEPT〉
〈DEPT〉
〈DEPT_NAME〉dept2〈/DEPT_NAME〉
〈DEPT_SHORTNAME〉d2〈/DEPT_SHORTNAME〉
〈DEPT_CODE〉code2〈/DEPT_CODE〉
〈DEPT_LEVEL〉2〈/DEPT_LEVEL〉
〈DEPT_PARENT〉dept0〈/DEPT_PARENT〉
〈/DEPT〉
〈/DEPTS〉
6.2 异构数据交换时,进行数据交换的双方服务器既是服务器又是客户端现假设部门1与部门2进行数据交换,这时可将部门1作为客户端,部门2作为服务端,其交换示意图如图1所示。具体的流程可以描述为:部门1通过调用SQL Server.NET或OLEDB.NET实现对数据库的访问,从部门1数据库中提取所需的数据,通过XML接口转换成XML数据文件,通过SOAP和HTTP协议,把XML数据文件发送给部门2;部门2利用XML接口和数据库接口[2],将接收的数据进行处理并存储到部门2数据库中。反之,部门2作为客户端,部门1作为服务端,流程相似。
7 小结
充分利用现有信息化资源,在已有的异构业务系统之间建立统一的信息交换平台,实现数据交换对高校网络协同办公具有特别重要的意义。利用XML技术实现异构数据的集成和数据交换,可以实现异构数据库之间的透明操作,在尽量节省费用、确保性能的前提下,较好地解决历史遗留的信息孤岛问题,实现数据的集成和共享。
参考文献
[1]张震,肖先勇.基于XML的电能质量标准数据共享模型及跨平台数据交换[J].计算机统应用,2007(27):12
[2]微软公司.面向.NET的WEB应用程序设计[M].北京:高等教育出版,2006
[3]微软公司.XML Web Service开发[M].北京:高等教育出版社,2004(10)