探析高校图书馆数据挖掘

来源 :考试周刊 | 被引量 : 0次 | 上传用户:wolffing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 数据挖掘技术在信息的利用和提取中发挥着日益重要的作用。本文介绍了数据挖掘技术的基本概念及功能,并对数据挖掘技术应用于图书馆的研究现状进行了分析,在描述数据挖掘技术的基础上,探讨了数据挖掘在数字化图书馆中的应用,旨在为图书馆在数字资源的组织和管理、服务质量的提升和服务方式的拓展等提供技术支持。
  关键词: 图书馆 数据挖掘 数据信息
  一、高校图书馆数据挖掘的概念及发展现状
  数据挖掘是指从大量数据中提取或挖掘隐含的信息或知识,可以在任何类型的信息载体或存储中进行。数据挖掘过程可分为三个阶段:数据准备、采掘操作、结果表达和解释。目前,它已经在银行业、工程技术、医学和零售业等领域得到成功应用和空前发展,在这些领域的成功应用鼓舞着人们将数据挖掘技术应用到更多、更广泛的领域中。其中,高校图书馆就是一个很好的例子,数字图书馆是计算机可处理的、有序组织的知识集合。
  随着网络上的数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的应用价值。数字图书馆可以突破文献单元的局限,以知识单元为基准进行信息挖掘和知识发现,从而发现有规律的认识。它将提供和实现资源共享,分散于不同载体、不同地域的数字化信息资源以网络化方式互相联结。除此以外,数字图书馆是多方面高新技术支持的数字信息资源系统。其使用数字技术进行信息资源的组织和管理,能够存储海量信息,用户可以通过网络获得信息服务,高效方便地查询、检索信息,并且其信息存储和用户访问不受时间及地域的限制。
  高校图书馆数据挖掘应用不是简单的互联网上的图书馆主页,而是一整套面向对象的、分布式的、与平台无关的数字化资源的集合。其过程通常是自动的,用户不必提出确切的问题,从而更有利于发现隐藏的知识。我们还可以利用数据挖掘的研究成果提高信息检索的精度和效率,改善检索结果的表达,使信息检索系统提高到一个新的水平。
  二、高校图书馆数据挖掘的运用
  数据挖掘在高校图书馆中的运用比较广泛,以下将从资源建设、个性化服务、图书管理等方面进行简单论述。(1)数据挖掘在图书馆资源建设上的应用。使用模式挖掘、学科动态分析,结合现有馆藏信息情况,采用合适挖掘算法及时发现信息资源的漏缺,做好文献的收集订购。对大量文档集合内容进行摘要、分类、聚类、关联分析,从大量的资源中抽取潜在的有用知识。采用各种数据挖掘技术与方法,评判数字图书馆文献信息资源的利用率、有效率等,以便建设特色馆藏。(2)数据挖掘在图书馆个性化信息服务中的应用。个性化信息服务不仅需要针对不同的用户需求提供不同的服务,更重要的在于发现用户的潜在需求进行主动的信息服务。数据挖掘技术为解决此问题开辟了一条道路。(3)数据挖掘在图书馆管理上的应用。数据挖掘作为一种深层次的数据分析方法,可以从大量的用户数据中挖掘反映用户属性特征和信息行为特征的信息及规则,从而为图书馆用户资源管理提供极大的帮助。
  此外,数据挖掘在数字图书馆结构上的运用,主要是从网页的组织结构和链接关系中获取知识,在此基础上对页面进行分类和聚类,或对相关网页进行分析,发现数字图书馆页面的结构和结构模式,从而对网页的质量进行评价,对检索方式进行优化。通过链接分析和掌握学科发展状况,指导网站的建设。
  数据挖掘可以帮助决策者分析历史数据及当前数据,从中发现隐藏的关系和模式,进而预测未来可能发生的行为。随着数据挖掘研究的深入,需解决的问题和面临的挑战很多。如:在不同的层次上进行交互的数据挖掘;数据挖掘结果是否具有准确性和有用性;用不同形式表示数据挖掘的结果;从不能结构的数据源中挖掘信息;数据挖掘的方法和模式虽然多样,却没有统一地对模型进行描述和定义,各数据之间缺乏联系,造成各数据挖掘系统之间的封闭。
  三、高校图书馆数据挖掘存在的问题及对策
  作为图书馆的未来发展趋势,数字图书馆拥有海量的数字资源,如何发挥其巨大作用、避免信息过量已经成为数字图书馆发展必然要面对的问题,而数据挖掘技术在数字图书馆应用面临许多的挑战。
  随着图书馆数字化程度与数字图书馆建设的不断强化,大多数图书馆纷纷引进全文中外文大型数据库,少则数个,多则数十个,提供的信息更多、更新、更广泛、更复杂。然而,目前这些数字资源尚未有统一的制作和显示规范,阅读格式和检索界面多种多样,互不兼容,使得读者需要安装多个浏览器,并且对同一个主题反复检索,效率低下。此外,图书馆的数据库系统可以高效地发挥数据的录入、查询、统计等功能,但无法从大量数据中获取数据背后隐藏的、内在的、有用的信息,发现数据中存在的关系和规则,以致无法为读者提供更方便、快捷、高效的服务。
  解决高校图书馆数据挖掘存在的问题,我们应该致力于找出解决问题的对策。为了避免陷入数据丰富,但信息贫乏的局面,图书馆有必要增强对信息的处理能力及对信息资源的组织能力,尤其是对海量信息的深层次的开发,提取表面上庞杂无序的信息的内在联系供读者使用。同时,采用数据挖掘技术对这些数据进行深入分析、研究对图书馆了解读者的借阅兴趣、图书采购、信息咨询等业务都有很强的指导作用,对提高读者服务质量、资源利用率有很大的帮助。
  参考文献:
  [1]谭观音,李继宏.高校图书馆期刊选订的模糊决策[J].现代情报,2011(8).
  [2]李朝葵,凌云.数据挖掘及其在图书馆中的应用[J].情报杂志,2011(6).
  [3]赵宏波,孟雅玲.数据挖掘在电信客户关系管理中的应用[J].电信技术,2011(2).
其他文献
介绍了单相SPWM逆变器,设计了它的LC滤波器,根据该方法选择LC参数,并且通过MAT-LAB仿真的方法对比了滤波前后输出电压频谱中的谐波含量.
目的2000年收治腹型肥胖伴高胰岛素血症的2型糖尿病患者,其中糖化血红蛋白10%以下、无高血压病者264例随机分为2组,每组132例。方法一组给予二甲双胍口服,一组给予磺脲类药口
采用文献资料和访谈法,对连云港师范高等专科学校社会体育专业人才培养模式的现状进行调查分析。结果表明“1+1”人才培养模式经过不断的摸索探寻,逐步“以市场需求为导向、
本文通过实践工程中经批准执行的一项吊篮平台脚手架的专项施工方案的编写,引导学生学习如何编写专项施工方案,加快同学们在实践中的成长。 Through the preparation of a s
目的探讨TGF-β1刺激后对皮肤成纤维细胞中磷酸化ERK表达的影响及相互关系。方法以原代培养人正常皮肤成纤维细胞为研究对象。细胞分2组:浓度组:10 ng/ml、5 ng/ml、1.0 ng/m
目的观察应用皮肤软组织扩张术修复烧伤瘢痕的效果。方法对我科2005年1月至2009年12月应用皮肤软组织扩张术修复烧伤后瘢痕患者67例临床资料进行回顾性分析。结果 60例患者修
在水利院校中对学生实施水文化教育具有非常重要的意义,在实施过程中要从知识、理念、行动三个层面进行,要循序渐进,通过各种途径与措施提高水文化教育的实效性,培育学生的水
重型颅脑损伤发病急、伤势重,病情变化快,来势凶险,并发症多,病死率、致残率高,临床护理工作繁重.严密观察、精心护理,对抢救重型颅脑损伤病员生命,改善愈后,提高生活质量极
目的:了解农村孕产妇性传播疾病患病情况及知识知晓水平,为制订针对性健康教育策略提供依据.方法:分层抽样方法,抽取300名孕妇进行调查.结果:农村孕妇性传播疾病防治知识知晓