浅谈数据仓库在图书馆信息资源中的关键技术

来源 :企业科技与发展 | 被引量 : 0次 | 上传用户:yy080408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】在互联网时代,图书馆信息资源快速增长,图书馆实现信息化管理成为必然趋势。数据仓库是一种能够优化图书馆信息资源的技术,能够为读者提供更加个性化的服务。数据仓库在图书馆信息资源中的关键技术包括联机分析处理技术与大数据挖掘技术,能够从不同角度、不同层面。不同纬度来实现对图书馆信息资源的高效管理,为读者提供更加理想的服务。
  【关键词】数据仓库;图书馆;信息资源
  【中图分类号】G250.73 【文献标识码】A 【文章编号】1674-0688(2018)07-0154-02
  图书馆要为读者提供更加完善的服务,就需要实现信息资源整合。图书馆信息资源整合是针对分散异构信息资源体系,在新信息交换与共享平台上开发新的应用,从而实现信息资源利用的最大化。图书馆信息资源整合是将分散异构的非结构化数据、异构的结构化数据进行管理利用,将其集成为不同应用系统,为所有者提供更加高效的资源管理。而数据仓库技术则可以为图书馆信息资源整合提供坚实的技术支持,为优化图书馆服务质量、提升图书馆资源利用率提供帮助。
  1 数据仓库与图书馆信息资源
  1.1 数据仓库
  1991年,W.H.Inmon编著的《Building the Data Warehouse》中将数据仓库进行了以下定义:一个用于更好支持组织决策分析的,面对需求的、综合的、稳定的,伴随时间不断变化更新的数据集合,主要用于支持管理决策。数据仓库的特点主要表现在以下几个方面:第一,数据仓库中的数据是有主题的,其是将数据在高层次上进行归类后进行分析利用。数据被储存在数据仓库前需要进行一定的加工处理,将原始数据根据主题来进行转变,以贴切主题需求。第二,集成性。数据仓库中的数据将分散的不同系统中的数据进行选择、转换后进入数据仓库,数据仓库中的数据是源数据的综合与统一。第三,更新性。数据仓库会伴随着时间段变化不断更新数据和内容,长时间不用数据也会被删除。第四,相对稳定性。数据仓库虽然会伴随着时间的推移更新数据,但是其却具有相对稳定性。相对稳定性主要是供数据仓库决策人做出决策所使用。相关决策人员可以利用数据仓库进行数据查询,通常不会对数据进行修改。当某类数据进入数据仓库后会被长时间保留,在一段时间后该数据会被相关规则转变为历史数据,从数据仓库转移到存储设备中。
  1.2 图书馆信息资源
  图书馆信息资源整合主要作用体现在以下几个方面:第一,提供决策支持。在经过一系列的信息资源整合后,各类数据信息再也不是无逻辑的分散信息,而是通过系统的提取、归类、转化形成了网络型关系信息。例如,通过综合报表、定制信息等方式,为图书馆决策提供了全面而精准的决策依据。第二,改善当前信息系统效能。在经过系统的信息资源整合后能够实现工作人员与应用系统之间的协同工作,利用当前信息资源,改善数据的利用率,为图书馆管理员个性化管理提供充足信息,从而提升了信息系统效能。
  2 数据仓库在图书馆信息资源中的运用
  2.1 图书馆信息资源整合与数据仓库应用的必要性
  随着互联网时代的来临及信息技术的广泛应用,图书馆中的各类信息资源类别在持续增加。不仅纸质文件得到了快速的增加,磁带、光盘、电子期刊、电子图书、互联网资源、网络数据等各类媒介的图书资源也在持续增加。同时,图书馆收藏的一些传统文献也添加了不同辅助信息为读者提供该服务。例如,出版商在提供一般文献的过程中还会适当提供相关题库信息,为读者提供更加丰富的服务。在信息资源建设方面为了获得更加显著的竞争优势,有的图书出版商推出了各类图书资源特色服务项目,如新书推荐系统、教师选书系统等。这些图书资源特色服务项目不仅大大提升了图书馆馆藏建设,还使得图书馆的电子资源更加丰富。但是在图书馆电子资源的实际应用过程中,通常电子信息资源都处于相互独立的状态,检索系统也相对独立,这给读者检索带来了一定的困难。读者对图书馆中的数据资源分类不熟悉,为了找到既定文献,读者必须进行多次重复搜索,大大降低了图书馆信息资源使用效率。
  基于这一现象,为了使得图书馆更好地服务读者,可以将异构数据库中的数据进行整合,对海量信息进行深层次开发,将信息资源进行整合,进一步强化信息资源组织处理能力。首先,可以利用数据仓库技术,通过多层次、多渠道来进行数据的收集,将采购历史数据、信息资源流通数据等进行整理收集,通过计算机互联网分析处理及数据挖掘等数据仓库技术,为图书馆信息资源的采购和整理提供更加高效的决策。其次,在数据仓库技术的基础上为读者提供更加便捷、更加快速的检索服务。对于读者来说,图书馆所馆藏的资源信息内容繁杂、类型众多,不仅涵盖了大量的纸质书籍,还涵盖了互联网中的海量信息。而数据仓库运用联机分析处理技术,直接面向主题,利用图书馆信息检索服务,根据用户的需求直接提供与主题相关数据,从而提高信息检索服务效率。同时,利用数据仓库技术还能够为读者提供个性化的服务,可以针对读者的浏览历史记录进行分析,对读者进行类别甄别,为读者推送感兴趣的、潜在的数据资源,为读者提供个性化的服务。
  2.2 数据仓库在图书馆信息资源中的关键技术
  数据仓库在图书馆信息资源中的运用涉及多种类型的关键技术,不同技术可以为图书馆信息资源整合提供不同的幫助。
  2.2.1 联机分析处理技术
  联机分析处理技术是一种软件技术,能够使图书馆工作人员快速、多方面地获取信息,从而达到深入理解数据的目的。获得的信息数据都是从原始数据中处理得来的,以用户最容易理解的形式来体现图书馆经营的真实情况。联机分析处理技术中的绝大多数策略就是将数据进行多维存储,以便进行联机分析处理。这类多维数据库主要是沿着不同维度方向来进行数据产出,能够让用户按照事物发展的轴线有逻辑地对数据进行分析。联机分析处理技术是数据分析技术的一种,其功能特点主要表现在以下几个方面:第一,快速。用户对联机分析处理技术的反应速度有较高的需求,通常需要在很短时间内做出反应,满足用户需求。第二,可分析性。联机分析处理技术能够快速处理与逻辑分析、统计分析相关的事物。在联机分析处理分析中,用户不需要进行编程就可以重新计算,将其称为分析的一部分,并以用户的需求为准给出相关报告。第三,多维性。联机分析处理技术中的多维性十分关键,能够提供数据分析后的多维视图及相关分析,是图书馆利用联机分析处理技术的核心。第四,信息性。不论数据量多么庞大,也不论数据存储在什么地方,联机分析处理技术都可以快速获取信息进行管理。在图书馆信息资源中,联机分析处理技术的运用方式主要包括3种,分别为切片、钻取及旋转。其中,切片即在多维数据结构中根据用户的需求进行二维切片或三维切块,以获得相关数据;钻取即转变数据报告方向,例如进行行列交换来获取数据;旋转就是转变维度层次,通过上钻取或下钻取的方式来获取数据。在图书馆信息资源应用中可以从时间维度及读者类型维度2个方向对借阅量进行切片;也可以从时间维度、读者类型维度、借出数据维度来对借阅量进行切块。整体来说,联机分析处理技术是数据仓库应用在图书馆信息资源中的关键技术之一,能够实现多维度访问数据,多角度分析数据,往往在图书馆信息资源中与数据挖掘技术一同运用。
  2.2.2 数据挖掘技术
  数据挖掘技术即从海量数据中挖掘获取有价值的信息,数据挖掘技术能够对海量数据进行分析,从而获取数据之间存在的隐藏联系,为用户决策提供依据。数据挖掘技术综合运用了统计学、计算机学、数学等技术,可以通过一系列方法来实现。例如,传统统计法运用数据挖掘技术进行抽样分析,在用户需求指导下进行合理抽样,在获得抽样数据后进行多元统计分析或统计预测,利用因子分析、回归分析、时间序列分析等方法进行。对于图书馆来说,数据挖掘技术能够提高图书利用率的相关问题。在读者所处环境及图书价值始终保持不变的情况下,对读者以往的借阅历史进行挖掘,以判断读者未来可能出现的借阅率,挖掘出各类读者对不同类型图书的需求,进而利用最终挖掘得出的数据结果来引导读者选择合适的图书资料。
  3 结语
  图书馆信息资源整合中的数据仓库技术能够充分实现信息的挖掘与利用,还能够与其他应用系统一同融合,实现图书馆数据库的拓展。在未来的发展中,图书馆数据仓库技术将会成为图书馆信息资源整合、自动信息化发展的必然趋势。
  参 考 文 献
  [1]韩璐.基于数据仓库的数据挖掘技术在高校图书馆管理中的应用[J].科学家,2016(15):77-78.
  [2]公立.数据仓库和数据联邦技术在信用信息资源存储和共享上的比较[J].科技创新与应用,2017(5):97.
  [3]吕欣.数据仓库与数据挖掘在图书馆决策管理中的应用[J].数字技术与应用,2017(6):89.
  [责任编辑:陈泽琦]
其他文献
【摘 要】投资基金需要支付一定的投资成本,投资者如果不注意控制投资基金的成本,就会在基金的投资中减少投资收益。文章通过分析非上市交易型开放式基金成本的构成,帮助投资者用较低的成本购买到好的基金产品。  【关键词】非上市交易型开放式基金;低成本;购买成本;费用成本  【中图分类号】F832.51 【文献标识码】A 【文章编号】1674-0688(2019)07-0170-02  1 提出问题  
[摘要]法国印象派作曲家德彪西·阿西尔一克洛德(Debussy·Achille-Claude)是印象派音乐的鼻祖,他的管弦乐作品运用了独特的配器手法,表现出绚丽的色彩和优美的意境。《牧神午后》是德彪西的早期作品,笔者以该作品为切入点对德彪西的印象派管弦乐配器风格进行了一次简要的介绍分析。  [关键词]德彪西;管弦乐;《牧神午后》;配器  在德彪西的配器初期,我们不难发现仍然存在着浪漫主义特点的影子
【摘 要】室内变电站电压等级高,配套电气设备单件重量大。在安装时,主要依靠人工和简单的工具,造成运输和就位困难。文章针对此问题,研究了专用的成套工装设备及配套的技术方案。一套工装由4个基本单元构成,4个单元同步运动。每个单元都具有平移和举升功能,并且相应的动作之间具有连贯性。专用工装可有效提高设备的安装效率,具有较强的实用性。  【关键词】分体式布局;4自由度;液压顶升;动作连贯性  【中图分类号
随着近年游戏产业的发展,游戏名称的商标侵权案件层出不穷。但是,由于我国《商标法》未对商标性使用的构成要件予以明确,学界和实务届对此均存争议。文章以"穿越火线"商标侵
【摘 要】文章从灰色预测模型GM(1,1)原理和误差检验入手,以铜旬高速滑坡监测示范工程点地表位移监测为例,介绍了灰色预测模型GM(1,1)在滑坡监测预警中的应用,并对监测数据与预测数据进行了比较分析,证明了灰色预测模型GM(1,1)在滑坡监测预警中的应用是合理可靠的。  【关键词】滑坡;灰色预测模型;GM(1,1);监测预警  【中图分类号】N941.5 【文献标识码】A 【文章编号】1674-
文章把客运量和货运量作为新的产出指标,构建DEA模型,测算了2010年--2013年安徽省16个地级市交通运输业的能源利用效率,并对安徽省交通运输业能源利用效率变化情况进行了动态分
李德甫 李欣治
期刊
基于GPS技术的土地变形监测手段应用,可有效排除噪声干扰和影响,而且可进行动态、高精度的实时监测。若GPS技术与小波分析和先进的技术方法结合应用,可显著提高应急防灾方面的效果。文章先对GPS技术在变形监测过程中的应用要点进行分析,并以某项目为例,就该技术的应用实践提出观点与认识。
乳腺癌是女性最常见的恶性肿瘤之一。隐匿性乳腺癌(occult breast cancer,OBC)是一种特殊类型的乳腺恶性肿瘤,具有特殊的生物学及临床特征。它的乳腺原发病灶隐匿,多以腋窝淋
中小企业是经济发展的重要组成部分,对推进区域工业化进程具有重要的作用。如何使中小企业在当前的经济环境中得到更好地发展,如何使会计师事务所确立自身的发展定位,完善管