论文部分内容阅读
现代科学研究对高性能计算能力和海量数据处理能力的需求飞速增加,迫切需要实现跨地域、跨部门的共享和协同计算。这种背景下,教育部提出建立中国教育科研网格,致力于集成CERNET中分布的异构资源为科研教学服务。
CGSP(中国教育科研网格支撑平台)是ChinaGrid核心中间件,旨在整合教育和科研系统中的各种资源,屏蔽网格资源的异构性和动态性,为各种科学计算与工程研究提供高性能的、高可靠的、安全方便的透明网格服务。信息服务是网格公共支撑平台中的核心服务之一,以统一的形式提供各类异构资源的注册、更新、检索与选择等功能。
本文中,CGSP以域为基本的运行单位,域可以理解成虚拟组织,每个域是一个可以独立运行的系统。每个域有自己的信息中心,而这些信息中心的域间通信可以将各个独立的域连接成有机的网格系统。网格系统的结构关系是层次关系,其域拓扑结构是树形的。采用这样的结构是为了方便系统的扩展以及管理。任何一个域中都有全局的域信息,即从任何一个域都能得到整个系统的结构,从而访问任何域。
本文的网格系统内资源信息的组织结构分为两层。在网格系统层,各个域的资源信息是独立的,各个域是对等的,任意两个域之间均可以产生资源请求;具体到域中,采用了MDS4的资源聚集框架,所有资源信息层次向上聚集到信息中心,由信息中心提供查询服务。这样,就构成了集中式与分布式混合的资源信息组织结构。
结合全局的域拓扑信息和资源组织结构,信息中心可以构建虚拟的全局资源信息视图,屏蔽资源物理分布的差异性,为用户提供透明的、一致的访问方法。用户可以在任何域以一致的方式访问整个系统的资源信息。
所有的资源信息都是用XML描述,以XMLSchema确定每类资源的元数据。这意味着,虚拟的全局资源视图可以看成一个巨大的XML文档。因此,系统采用XPath作为查询语言,XPath非常灵活,几乎资源的任何信息均可用作查询条件。考虑到查询涉及多个域之间的交互,系统还设计了简单的以XPath表达式为基础的缓存机制。
目前,CGSP已经在全国12所高校部署,部署在系统中的应用也逐渐在丰富。从运行情况来看,域间信息服务能有效的将各个域组织在一起,为用户提供良好的服务。