论文部分内容阅读
目前我们所处的社会是一个高速发展的信息化社会,传统图书馆越来越不能满足这种信息化、网络化的需求,于是,数字图书馆产生了。这其中有两个重要原因促成了数字图书馆的大发展,一是人们迫切需要对各种信息资源进行方便快捷查询;二是互联网的高速发展为这种需求提供了基础。和传统图书馆相比,数字图书馆利用最新的计算机技术和通信技术,建设大规模、可互操作的分布式知识库,实现资源共享,并提供在互联网上高速的统一检索服务,从根本上改变了目前信息分散、无序、不便使用的现状。
本文从数字图书馆入手,介绍了数字图书馆相关内容。着重介绍了数字图书馆相关技术:数据描述技术、信息检索技术、信息集成技术、数据存储技术。在信息检索部分阐述了一些当今流行的技术,在信息集成部分分析了当今大部分统一检索系统所采用的技术。这些系统一般原理是:运用元搜索引擎的基本原理,利用数据库的Web客户端进行统一检索;通过数据库接口软件与不同的数据库直接连接,如ODBC和JDBC等;不同数据库间的格式转换。由于这些技术本身的不足,所以大部分统一检索平台都有一些不足之处:系统稳定性差,不易扩展;各数据源查询结果排序方式不同,对检索结果的融合处理实现复杂、时空性能不佳,而且效果不理想;对返回的异构结果记录大多采用WEB页面格式,需要进行大量的字符处理来解析记录,造成检索速度较慢,而且很难进行分类等二次处理。
因此,必须选用一种新的技术来实现真正意义上的统一检索。Web services技术具有跨平台、跨语言、简单、高效、可扩充的优点,它的通用性更强、结果信息处理能力更强、还有强大的二次开发能力和完善的信息源标识功能。可以解决现有异构数据源统一检索方案中存在的问题,采用web services技术具有明显的优势,因此本课题将Web服务技术引入到异构数据源统一检索的信息集成平台研究中。
接下来详细介绍了web services技术,包括它的体系结构、技术规范、优点等。在这个基础上,本文采用web services技术,按照统一检索结构的要求,分析了数据资源子库的三种分类,详细阐述了信息集成平台中翻译转化用户请求、处理请求信息、整合查询结果返回用户三部分,设计实现了统一检索系统的信息集成平台。
本文主要采用了开源软件axis实现web services,使用了java、mysql等,利用南京陆军指挥学院图书馆的数字图书馆的一些数字资源做了试验,基本上能够实现预期的目标。