基于关联规则的高校图书馆流通数据分析与研究

来源 :经营管理者·下旬刊 | 被引量 : 0次 | 上传用户:hwren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文以陕西某大学图书馆为研究对象,对其历史流通数据进行预处理,通过关联规则及分类等方面对书籍流通借阅数据进行挖掘分析,得到书籍大类之间、书籍与书籍之间、借阅书籍与借阅时间之间、读者与借阅书籍的关联模型,实现对读者行为规律分析,同时也为陕西某大学图书馆工作在人力资源配置、馆藏资源建设及读者服务等方面提供了决策依据。
  关键词:关联规则 高校图书馆 书籍流通数据
  网络环境下的高校数字图书馆伴随着海量信息资源的产生,高校图书馆流通部门作为服务全校师生的资源中心,每天产生大量的流通借阅数据。研究如何有效发现这些数据资源背后的规律,形成相关规则与知识,对于服务现代化的图书馆建设具有重要意义。
  一、关联规则的概念
  频繁模式的发现是关联规则挖掘的核心。在数据集中频繁出现的模式称为频繁模式(frequent pattern)(如项集、子序列或子结构)。频繁模式可以帮助我们发现数据之间的有趣关系。有些时候频繁模式的挖掘可以协助其他数据挖掘。例如,在聚类挖掘之前可以用关联规则挖掘来实现数据的预处理。这样可以帮助聚类工作更好的进行。因此,如何更好的发现频繁模式就成为了关联规则挖掘的核心任务。
  二、实例分析
  1.书籍流通数据预处理。挖掘数据来源为陕西某大学图书馆管理系统2014年流通数据,此数据中含有大量异常及空白数据,这些数据对数据挖掘意义不大,从一定程度上来会降低数据挖掘的效率,因此需要对原始数据进行数据预处理,形成挖掘数据源。
  1.1图书索书号的转换。本大学图书馆图书分类是按《中国图书分类法》划分。由图书管理系统导出的索书号分类过于详细,且数值相对分散,为了能够进行有效的关联分析,有必要对流通借阅表中的图书索取号进行预处理。在所书号记录里只取前三个字符,分别对应一级类目、二级类目和三级类目。SQL语句如下:
  SELECT left(索书号,1) AS 一级类目, left(索书号,2) AS 二级类目, left(索书号,3) AS 三级类目, *
  FROM 流通借阅表;
  1.2提取读者类型。本校读者证号第一位数代表读者类型,“3”开头的是本科生、 “2”开头的是研究生、“1”开头的是博士、“0” 开头的是社会读者“T”开头的是教师、“B”开头的是博士。SQL语句如下:
  SELECT left(读者证号,1) AS 读者类型,*
  FROM 图书流通数据;
  1.3借阅时间的格式转换。本校图书馆系统的时间格式为文本类型,具体格式如“2014-12-02 16:37:07”。为了符合挖掘需求,现将借阅时间拆分为年、月、日,代表借阅的时间期。SQL语句如下:
  SELECT mid(借出时间,1,4) AS 年份, mid(借出时间,6,2) AS 月份, *
  FROM 图书流通数据2;
  通过上述方法对流通借阅数据进行预处理,为后续数据挖掘与分析提供了良好的数据保障。
  2.基于Apriori算法的不同借阅图书之间的关联分析。通过对流通借阅表字段索取号分组计数,对书籍借阅量大、利用率高的图书进行关联分析,进而发现不同书籍借阅之间的关系。在IBM SPSS Modeler中利用Apriori算法挖掘,得到如图2-1所示模型。
  相关规则说明:
  规则1中,有8.333%的读者会借阅书籍O151.2/412/2012、书籍O441.4/134,借阅书籍O151.2/412/2012的读者有100%的可能会借阅书籍O441.4/134;
  规则2中,有8.333%的读者会借阅书籍TH137/210、书籍TH122/1184、书籍O151.2/412/2012,借阅书籍TH137/210的读者有100%的可能会借阅书籍TH122/1184、书籍O151.2/412/2012;
  本次关联的实验数据:规则数,5;有效事务287条;最小支持度8.333%,最大支持度13.889%;最小置信度75.0%,最大置信度100%。构建设置主要包括:最大前项数,5;最低条件支持度,7.0;最小规则置信度(%),70.0。
  结果分析:通过上述规则可知,不同书籍之间存在某种关联,存在强关联的书籍很大程度上是同一大类下的书籍。从图书馆的角度来看,图书采购、图书推荐工作对存在强关联的书目管理应是同步的;同时,在书目摆放上也应该是临近摆放,既方便了读者借阅 ,又提高了服务效率。
  三、针对陕西某大学图书馆工作的相关建议
  结合上述挖掘分析结果,可以为高校图书馆的工作安排、馆藏管理及读者管理提供科学的参考依据。图书馆作为在校学生的第二课堂,应积极地做好信息服务工作,熟悉一定时期读者的阅读倾向,进行健康的、科学的阅读引导。下面结合本次分析结果,根据陕西某大学图书馆现状,提出以下几点建议。
  1.图书馆人力资源的科学安排。通过时序关联挖掘分析,根据得出的读者全年每个时期的阅读规律,以提高服务效率为目标,可以合理的在馆内进行人员的岗位交流,尤其是在人力资源匮乏的情况下。具体做法表现为:在每个学期开学之初,可以对图书借阅部门加大人手投入,提高书籍借阅效率,提高服务满意度。在借阅低谷时期,保证正常流通借阅外,可以安排一些业务学习、图书编目等工作,提高图书馆员的素养和馆藏质量,为图书馆的流通服务提供良好的软件基础,坚决抵制资源的无谓浪费。
  2.优化馆藏资源。从图书种类之间的关联关系来看,B哲学、宗教、C社会科学总论、K历史、地理、T工业技术等大类存在着强关联,读者通常会同时借阅。因此图书馆可以在书库藏书的安排上进行合理规划,将之间存在强关联的图书种类放在同一馆藏地点,方便读者查找借阅,方便还书上架,同时也降低了员工的工作量,提高工作效率。在采购图书环节,传统的采购主要表现为:学科馆员的推荐和经验法两种形式。这两种方法都忽略了图书馆的服务主体---用户。通过馆藏文献挖掘我们得到了图书利用率排序。在馆藏管理中,对利用率高的书籍可通过增加副本和采购是更多读者能够使用图书;对利用率低的图书,根据文献老化的不同程度进行图书剔除,做好馆藏的资源更新。提高馆藏的利用率,让馆藏资源适应读者需求,是高校图书馆能够提供用户满意服务的前提条件。
  3.推行读者个性化服务。对于不同类型的用户,根据其借阅的相关规律,从而进行针对性服务。根据以上挖掘分析,不同类型读者的借阅量及借阅书籍分类都有所不同。图书馆可以根据不同类型、不同专业、不同年级的借阅特点,针对其不同需求提供差异化的读者服务。如将具体方式表现为公告栏、突出摆放藏书等具体方法在馆内服务大力推广;同时,在馆外服务方面,可借助手机终端的微信平台进行图书信息推荐服务,也可在图书馆网页中,结合用户借阅模式,进行新书推荐服务。
  参考文献:
  [1]张春杰.基于Apriori算法的校园空调的节能研究[D].杭州电子科技大学, 2014.
  [2]曾舸,刘先锋.关联规则挖掘中 Apriori改进算法的研究[J].计算机与现代化,2007(1):46-48.
  [3]韩家炜[加],堪博(Kamber.M),著,范明,孟晓峰,译.数据挖掘:概念与技术[M].北京:机械工业出版社,2007:3-18.
  作者簡介:王建行(1981—)男。民族:汉。陕西富平。硕士。讲师。图书馆学及信息管理方向。
其他文献
摘 要:高校校园书吧是一种新型的文化休闲场所,应该成为校园文化休闲生活建设的活动平台和景观窗口,书吧经营策略及其运行模式则是发挥和放大其功能的关键所在。以江西财经大学“书程小驿”项目为例,探索大学生创业训练项目实施过程,包括: 校内问卷调查及结果分析; 校内市场需求及消费者行为调研分析; “书程小驿”产业项目可行性 SWOT 分析。以实现以下运营目标: 培养江财学子创业能力,树立“书程小驿”品牌效
期刊
摘 要:档案管理是企业管理的重要组成部分,记录了企业的发展历史和重要信息资料,对企业的管理和发展具有重要的价值意义。随着网络信息技术的不断发展,档案管理的信息化水平也越来越高,这不仅提高了档案管理的效率,也极大地解放了人力、节约了资源,同时,也要求档案管理人员要不断更新档案管理观念,勇于探索新的档案管理方法,使档案管理的效益实现最大化。  关键词:现代档案 档案管理 管理方法  档案管理主要是对档
期刊
摘 要:本文分析了B2C电子商务系统信任研究的现状,从信任研究发展出发,分析了当前电子商务系统信任研究的瓶颈和发展方向。  关键词:B2C 电子商务 商务系统  因特网在最近的这几年中发展势头变的非常的迅猛,所以B2C电子商务在此时也表现出了非常大的潜力。但是电子商务这种线上的市场与线下市场目前的收入差距仍然存在。很多的购买者在线上不愿意进行购买的原因最主要的就是对电子商务的不信任,在电子商务的发
期刊
摘 要:对中国著名“丑”的异形建筑的整理归纳,分析其存在外形过于奇特、刻意象征和隐喻、体量大与环境无法融合、经济性差和不适用等问题;“丑”建筑出现是建筑师不坚持学术原则、业主的意志、政府官员意志、公众建筑审美水平较低等共同作用的产物;提出了防止“丑”建筑出现的办法。  关键词:异形建筑 存在问题 存在原因  随着中国经济的发展,中国的建筑业随之迅猛发展,各种各样的建筑类型也层出不穷,可以不夸张的说
期刊
摘 要:地方政府购买服务随着我国各级政府相继推出相关政策成为近年来的研究热点。本文以泉州市市政工程管理处实施政府购买服务工作为实证案例,通过分析存在的问题,提出相关对策建议,以此来促进购买服务的政策实施,真正实现政府职能转变的目标。  关键词:政府购买 市政设施 泉州  十八届三中全会强调,要“推广政府购买服务,凡属事务性管理服务,原则上都要引入竞争机制,通过合同、委托等方式向社会购买”。当前,我
期刊
摘 要:本文对于农业休闲景观基本问题展开了论述。休闲农业景观设计主要涉及的内容为农业生态景观和人造景观。设计者在进行景观的设计时,应充分考虑到该设计成果既要满足旅游者的消费、旅游需求,也要满足当地居民的生活休闲需求,要具有观赏性、趣味性、参与性和市场性。一个好的农业休闲景观设计,将会充分体现出休闲农业景观区的农业科学教育、农业自然生态展示、农业休闲娱乐和综合服务管理等功能。  关键词:农业休闲景观
期刊
摘 要:我国自2014年起开启了精准扶贫工作,提出到2020年实现全面建成小康社会的目标。由此,本文以珙县贫困户为对象,对山区贫困户致贫原因开展调查,并对结果加以整理分析,提出脱贫致富的对策。  关键词:西南山区 精准扶贫  改革开放以来,我们国家在全国范围内进行开发式扶贫,经过几十年的努力,累计减贫7亿多人,走出了一条中国式扶贫道路。时至今日,条件好的贫困地区和百姓都已经先期脱贫,剩下的都是一些
期刊
摘 要:随着计算机技术和电子通信技术的发展,电子商务的发展有其必然性和可能性,传统企业在电商的冲击下,不得不面临着企业转型的问题。本文主要介绍电子商务的相关概念,通过对电子商务行业现在的外部环境的宏观分析,阐述了电子商务目前的发展状况和行业环境,并梳理出传统企业向电商转型的挑战。另外,本文还基于博弈论建立了传统企业和客户的静态博弈模型,说明传统企业向电商转型的可能。最后,本文还对于传统企业向电商转
期刊
摘 要:随着国家的发展与社会的进步,人们的生活质量也随之提高。但是在社会的转型期问题层出不穷,严重影响了人们的生活质量,使人们的生命财产受到损失。公共危机指的是社会价值观与生态系统受到事件的威胁,从而产生不确定性后果,致使人民对政府的行政管理能力有所质疑。基于此,本文对我国公共危机管理中行政沟通障碍问题进行分析。  关键词:公共危机 行政沟通 障碍  一、公共危机管理概述  1.危机与公共危机的含
期刊
摘 要:对政府服务部门公众满意度测评是建设服务型政府的一项基本工作,也是衡量服务型政府建设水平的标准之一。本文基于问卷调查的方法,对某政府服务大厅进行访客调查,并运用SPSS获得了详细的满意度评价指标值。分析调查结果,访客对该服务大厅处于基本满意状态,对于影响提高满意度的因素,本文给出了相应的改进意见。  关键词:政府服务大厅 访客满意度 问卷调查  一、引言  近年来,我国将政府职能转变列为社会
期刊