基于数据挖掘技术的复合图书馆流程优化研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:pianolaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
早在3000多年前,图书馆已开始产生,数千年以来,图书馆的工作主要围绕竹简、纸质文献等进行人工服务,效率比较低下。而近30年来,以PC和Internet为特征的信息技术快速发展,为新兴的数字图书馆提供强大的技术支持。从上世纪90年代初美国的DL1开始,数字图书馆的发展非常迅速,从最初的图书资源数字化,到Google雄心勃勃的虚拟图书馆计划,短短十几年时间,对图书馆这个有数千年历史传统的产物产生极大的冲击。各个国家和地区投入巨资研发和建设数字图书馆,并把它上升到国家信息基础设施的地位。我国从1996年开始启动数字图书馆项目,一系列项目如中国实验型数字式图书馆(CPDLP)项目、中国数字图书馆工程(CDLP)、国家科技图书文献中心(NSTL)、中国高等教育文献保障系统(CALIS)等数字图书馆示范项目的实施,有力推动了数字图书馆在中国的发展。1996年,英国学者苏顿(S.Sutton)最早提出了复合图书馆这一概念,将来很长一段时间的图书馆形态既不是纯数字图书馆,也非纯传统图书馆,而是二者相互渗透的一种新型图书馆——复合图书馆。复合图书馆要同时承担传统图书馆和数字图书馆的社会职能。数字图书馆的实施,产生了海量的数据资料,几乎与数字图书馆概念同时出现的数据挖掘技术,为我们分析海量的数据资料提供了手段。国内外也有大量学者对采用不同技术手段对相关的数据做了分析和应用,但缺少针对具体高校复合图书馆进行全面的分析和探讨,而本文要解决的问题正是"如何利用数据挖掘的技术手段,通过对实际运行数据的分析,揭示复合图书馆运行内在的一些规律,优化复合图书馆运行流程"。本文抓住资源的采购模型,编目自动化和基于用户兴趣的个性化服务等复合图书馆运行过程中的关键环节进行讨论。(1)本文首先结合实际工作,根据复合图书馆的建设理念,通过对南京财经大学图书馆实际运行过程中的现状进行分析,提出了基于数据挖掘技术的复合图书馆模型,并对复合图书馆模型中的业务流程优化进行了分析,指出通过业务流程的优化,可以优化资源建设的力度,改善运行的环境,减少管理成本,提升图书馆的服务功能。(2)为了服务于图书采购,本文通过对图书馆读者借阅数据进行数据挖掘,揭示图书馆纸本图书使用情况,建立优化的图书采购模型,在不降低读者需求的情况下缩减复本,减少纸本图书采购经费比例,节约经费向数字资源建设倾斜。对图书二级馆藏的可行性进行验证,确立二级图书馆藏架构,减少馆藏环节,节约管理成本。(3)本文针对图书编目的现状,把信息自动化技术引入到图书编目工作中。尝试使用机器学习的方法对图书进行自动分类,克服基于知识工程的图书自动分类和数据挖掘的分类进行图书分类的问题,并验证了机器学习的方法在图书自动分类中的准确性和合理性。本文还对基于条件随机场的书目自动标引进行研究并进行实验分析,得出条件随机场(CRF)的书目自动标引可以只选用书名字段进行标引的结论。同时,为了分析学生读者的借阅行为,本文还针对读者十年来的借阅数据,挖掘和发现读者的读书兴趣,包括读者的个人兴趣和兴趣群体,读者课程成绩与借阅习惯之间的关系,这将有助于针对性的构筑个性化服务体系,提高图书馆的服务能力。纵观全文,主要有以下创新点:(1)通过聚类分析和统计分析清晰的发现图书的使用状态,优化图书采购模型,并实际应用到工作中:图书馆的核心用户群体的发现,读者专业与借阅习惯关系、课程成绩与借阅习惯的关系等信息的挖掘有助于提高图书馆服务的指向性,基于用户兴趣的个性化服务比传统的个性化服务具有更强的针对性。(2)通过流程的优化,可以改善资源建设,编目,流通等业务环节,减少差错,提升服务,提出基于用户需求的复本补充模型;(3)机器学习方法应用于图书自动分类的研究是有效的,基于条件随机场的书目自动标引可以简化。
其他文献
保护和改善生态环境是当今世界全人类面临的共同问题,随着近年来我国经济的快速发展和现代化城市建设步伐的加速,生态园林城市建设被列为重要议事日程。园林绿化作为生态型城
目的比较不同干预模式在老年支气管哮喘患者自我管理中的效果。方法选取2013年12月至2015年12月空军总医院干部病房三区收治的老年支气管哮喘患者158例,根据入院先后顺序分为
进入新时期后,网络技术发展迅速,方便了人们的生活和工作,促进了社会经济的发展。但是,在诸多因素的影响下,计算机网络信息系统还存在着较多的安全问题,需要引起人们足够的重
由于有着可扩展性和自描述性等特点,XML格式得到了越来越多的采用,其结果是产生了大量以XML格式表示的文档。随着XML文档的大量涌现,用户迫切地需要对XML文档进行有效地查询
现在的医学技术不断提高,随之而来的是输血技术及方法的不断创新与改进,并且输血学科和儿科学之间关系也越来越密切了。因为儿科患者的年龄在18岁以下,这一年龄段的孩子的身
创客,在创意中创新,在创新中创造。创客,必然是要动手实践的;创客,必然是要打破学科界限的;创客,必然是要充满想象力、有创意的;创客,必然是不拘泥于形式与载体本身的。一、
福建水口电站建成后,闽江河道变宽、水流变缓、水质变肥、小型野杂鱼、虾增多,十分有利于鳜鱼的繁衍生长。库区群众采捕、收购野生苗种进行网箱养殖,利用丰富的饵料鱼资源,在
介绍如何根据本单位的设备管理要求,应用Excel自己编辑设备管理软件.此软件具有编辑方法简便,使用方便灵活,针对性强、易于操作和修改的特点.
谷氨酸作为人体非必须氨基酸之一,起到调控机体基本能量代谢作用,同时在机体运动疲劳恢复中也发挥重要作用。谷氨酸促进运动疲劳恢复机制包括:清除运动过程产生的代谢废物及
目的探讨奥氮平在抑郁症患者中的临床应用及疗效。方法选取2011年12月~2012年12月于我院实施治疗的抑郁症患者62例,随机分为两组,其中对照组(31例)实施常规治疗,观察组(31例)