数据挖掘建模在高校图书馆中的应用

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:WHDMJ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着数据库管理系统在图书馆中的应用,大量的数据积累在系统中,如何选择、利用数据挖掘工具充分挖掘出数据中隐含的有价值的信息,为读者提供更加人性化的服务是当前图书馆管理员面临的严峻问题。本文就利用SQL Server2008这一数据库管理系统对学校图书馆中的数据进行挖掘进行探讨。
  关键词:数据挖掘;SQL Server2008;聚类分析
  中图分类号:G258.6 文献标识码:A 文章编号:1007-9599 (2012) 17-0000-02
  在高校里图书馆是一个非常重要部分,图书馆的管理方式最重要的体现就在于高校管理信息化。图书馆里的图书由于资料很多,有大量的数据都是需要严格的管理。但是采用人工方式进行管理的话,整体效率就会低下。现在,大部分的图书馆都是采取数据库管理系统,但是数据的挖掘功能却没有很好的被利用。SQL Server2008这是一款很重要的数据库管理系统,它能够很好的把图书馆管理系统当中具有价值的信息挖掘出来,给管理者一个很好的参考价值,让读者有更好的个性化服务。
  数据挖掘建模应用图书构建中:
  1 挖掘工具的选择
  SQL Server2008 中的数据挖掘组件是数据挖掘工具的典型代表,系统中引入了多个新的数据挖掘算法,与传统的数据挖掘工具相比,SQLServer2008数据挖掘功能具备很多优势。基于SQL Server2008有着非常实用的数据挖掘功能,所以选择其作为挖掘工具。[1]
  2 数据收集和整理
  本校采用的图书管理系统不成熟,所以它的应用系统功能是比较简单的,因此对于数据的整理相对来说比较杂乱。
  (1)从服务器端导出相关数据的信息表。由于系统功能简单,相关的数据表当中只有类别的编号,没有名称,所以不能完整的表达出图书类别的相关信息,所以我们需要应用人工将数据导出来之后,进行数据汇总。
  (2)启动SQL Server 2008 Management Studio,在对象资源管理器中新建一个数据库“library”数据库,然后建立“lib”表,将数据填写在表中,如图一。ID:编号,yxzy:是否是医学专业,sjlx:书籍类型,js:借书情况,xj:是否续借,jdrs:接待人数。
  3 对library数据库进行数据挖掘,建立模型
  (1)启动 SQL Server Business Intelligence Development Studio,新建一个商业智能项目。
  (2)新建数据源(DS),把library数据库添加进来。
  (3)新建一个数据库数据源视图(DSV)。
  (4)使用数据挖掘向导建立数据挖掘结构和挖掘模型。
  (5)處理挖掘模型。
  (6)使用挖掘模型进行分析、预测。
  4 对挖掘的信息进行分析汇总
  (1)该表通过数据汇总之后,摘录了18条有代表性的记录,进行分析。按是否是医学专业类别分书籍,共为两类:是和否;借书情况分为三类:好、一般、差。是否续借,分为两类:是和否;接待人数分为三类:<100,100~200,>200。以100和200为基准的原则是按照各个系别的人数划分,有些医学专业的人数比较多,例如临床医学,有些则适中如解剖,有些则是非医学专业的人数比较少,如:计算机。
  (2)采用聚类分析数据挖掘方法继续分析
  聚类分析(clustering)。聚类分析可以建立宏观的概念, 发现数据的分布模式,以及可能的数据属性之间的相互关系。聚类算法对dbo.lib,得出如下结果,如图二。
  图二直接给图书馆管理人员提供了决策依据,为以后的工作提供了理论依据。比如根据图二依懒关系网络图,可以发现,书籍的是否续借直接和该书籍接待人数和是否借书的情况有关系。根据图三发现,接待人数多的则是医学专业的人比较多,而非医学专业的人则少,可能是因为这方面的图书太少,相关书目更新速度太慢,没有新的书籍,还有就是这些专业是学校新兴的学科,没有及时的购买书籍。但是非医学专业的书籍,如文学类的图书被借阅的次数最多,这也是让非医学专业接待人数在其中占一个大比例的原因,应该把该类图书置
  于易于存放的位置,以便为读者提供更人性化的服务等。同时也应该增加一些图书馆中,书籍的种类。
  5 结语
  在图书管理中,引进数据库系统以后,节约了大量的人力、物力,大大提高了办事效率,使用数据挖掘技术可以挖掘出大量数据中隐含的信息,通过这些信息可以为管理者提供更直观的决策依据,采取更及时有效的措施,为读者提供更加人性化的服务。
  参考文献:
  [1]张尧庭.数据采掘入门及应用[M].北京:中国统计出版社,2001.
  [2](加)韩家炜,(加)坎伯(Kamber,M.).数据挖掘概念与技术[M].范明等,译.北京:机械工业出版社,200.
  [3]郭华伟.基于内容聚合BLOG学习平台的辅助教学研究与实践[D],北京:首都师范大学,2006.
  [4]王夕宁,王晓平.JSP通用模块及典型系统开发实例导航[M].北京:人民邮电出版社,2006:288-296.
  [5]方睿,刁仁宏,吴四九编著.网络数据库原理及应用[M].四川:四川大学出版社,2005,8.
其他文献
什么是网络安全网络安全是指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。网络
摘要:试验根据“3414”肥料试验方案,采用3因素4水平二次回归通用旋转组合设计,通过不同氮磷钾配比施肥处理,研究不同施肥配比对0901枸杞叶片中氮磷钾含量及抗性相关指标的影响。结果表明:不同施肥配比对枸杞春梢生长量影响明显,并可根据春梢停止生长时的长度进行建模;不同配比处理对枸杞叶片中细胞酶活性影响明显,SOD活性最高为329.2 U/g,[JP3]最低为149.1 U/g,POD活性最高为2
随着科学技术的发展,计算机技术也在飞速的发展,然而计算机的组装与维修已经不再是神秘之事,本文主要是结合作者多年的经验谈一下有关计算机组装和维修的一些见解。
本文对一道期末试题的立意进行了剖析,从理论探、试题分析、教学思考等多方面加以阐述对提高命题水准有积极意义.
摘要:从不同侧面和角度讨论并分析了Oracle 9i数据库系统的安全管理机制,为数据库管理员和数据用户如何尽可能地保障自己的信息安全提供借鉴。  关键词:数据库;权限;备份;角色  中图分类号:TP311.131 文献标识码:A文章编号:1007-9599 (2011) 16-0000-01  The Security Management System of Database   Jin Jin
随着业务的扩展,3G面临着各种各样的安全威胁。安全问题已经成为3G通信中一个重要的问题。本文首先从整体上对3G的安全体系结构进行了分析,阐述了3G的安全原则与目标,接下来较详
摘要: 采用超声提取广东紫珠中的连翘酯苷B和金石蚕苷,用HPLC法测定其含量,并考察其与抗氧化活性的相关性。色谱柱为sunfire C18 4.6 mm×250 mm色谱柱;流动相为乙腈:水(含0.1%甲酸)的溶液(18 ∶ 82);检测波长为332 nm。抗氧化活性采用DPPH法和铁氰化钾还原法测定。测定结果,广东紫珠药材中连翘酯苷B和金石蚕苷含量最高的分别来自江西武宁和萍乡芦溪,相关性分析结果
数的开方是初中代数的一个重要内容,由于全新的概念较多,在学习过程中难免会出现这样或那样的错误.下面举例说明,以避免类似的错误发生.
简要介绍了投资计划管理信息系统(一期)项目在茂名石化的设计与实现。论述了投资计划管理信息系统(一期)总体架构、功能描述及采用的技术路线,以及项目实施带来的效果等。
Vlan将一个大型的企业网划分成多个独立的子网,这样可以避免在核心交换机上进行的广播所引起的广播风暴,同时也便于对网络进行管理。Vlan技术在网络中应用的灵活性需要更多技术