论文部分内容阅读
摘 要:文章论述了在大数据时代公共图书馆数据挖掘的必要性及公共图书馆数据挖掘的流程,分析了图书馆对数据进行可视化处理的必要性及需要进行可视化的数据资源内容,阐述了公共图书馆数据可视化信息交互系統的功能及特性,并对图书馆进行数据挖掘后对数据可视化的作用做了相关例证说明。
关键词:公共图书馆;数据挖掘;可视化技术
“大数据”一词,最早由全球知名咨询公司麦肯锡提出,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产效率增长和消费者盈余的到来。“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而做出,而并非基于经验和直觉。搜索、买卖、产品制造等各种行为都有“大数据”的身影。数据挖掘是指通过统计分析从大量数据中提取隐藏于其中的规律,并用这些规律来预测未来或指导未来工作的科学。
1图书馆与数据挖掘
目前公共图书馆主要职能有:保存人类文化遗产、开展社会教育、传递科学情报、开发智力资源及提供文化娱乐的功能。其中开展社会教育、传递科学情报、开发智力资源等职能赋予了图书馆知识“搬运工”的身份,然而作为知识的“搬运工”,在“大数据”时代却遭遇到了前所未有的挑战。公共图书馆已经不再是过去的垄断时代中人们免费获取信息与知识的主要途径。Google、百度等搜索引擎成了越来越多人获取知识与信息查询时的第一选择。在这样一个趋势下,图书馆该何去何从?
公共图书馆提供的文化娱乐功能决定了其不仅是知识的“搬运工”,同时也是社会的“服务员”。作为“服务员”,如何更好的利用“大数据”时代的特点,为广大的读者提供更加高效、优质的服务也是十分值得公共图书馆探讨的。
2图书馆数据挖掘的必要性
大数据时代,一切都应以数据说话。图书馆的数据总体上分为两类:图书馆的资源与各业务系统数据。以广西壮族自治区图书馆为例,目前,广西壮族自治区图书馆现有的资源包括:馆藏实体书、电子书、商用数据库、自建地方特色数据库和八桂讲坛视频等。若能有效挖掘出各种资源之间的关联性、做好资源的自动揭示,有助于高效、便捷的给读者提供其最需要的资源,让其从中获得所需的知识,那么图书馆依然是知识的优秀“搬运工”。
Google、百度在很多小知识方面有优势,图书馆只要做好资源的揭示,就能提供的专业、系统和全面的知识给读者。同样以广西壮族自治区图书馆为例,广西壮族自治区图书馆现有各种业务系统包括:opac系统、rfid系统、统计分析系统、视频在线系统等。这些系统,每天都在收集大量的业务数据,通过对这些业务数据的挖掘与分析,可以有效找出我们服务中的优势与不足,从而提高服务质量及服务效率,充当好社会的“服务员”。一言以蔽之:做好对图书馆资源和各业务系统数据两方面的数据挖掘工作,是提升图书馆社会效益最佳途径。
3图书馆数据挖掘流程
数据挖掘的过程,一般而言可以分为三个阶段:数据准备、数据挖掘以及结果表达与解释。数据挖掘的方法包括:分类、聚类、关联、预测。比较合适资源揭示的是分类、聚类和关联,而合适各业务系统数据挖掘的是分类、关联和预测。
4图书馆数据的可视化
从上图可看出,可视化是数据挖掘的最后一步,也是数据的展示阶段。可视化(Visualization)指的是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。通俗地说,可视化是将数据图形化,使其更加符合人类本身对于事物的认知习惯,从可视化的定义不难看出,经过可视化处理的数据能达到准确、简单、直观、易于掌握的效果,可视化数据直观明了常人易于理解,因此,经过可视化后呈现的数据,可以反过来用于决策分析。
以广西壮族自治区图书馆为例,每个阅览室新到的图书,可以通过元数据的ISBN等字段与电子书封面的资源相匹配,在相应门口的读报机屏幕保护时展示封面给读者,同时使用时提供给读者在阅览室门口的读报机上查看并进行前十页的阅读,以增加读者对新文献的了解和兴趣。这里每个阅览口对应本阅览室的新书,实际上就是数据挖掘中的分类方法。当然,如果这些新书还进行了资源间的聚类,能关联到同类的资源,揭示的效果会更好。再如馆内的宣传片在大门处LED屏的播放,起到了很好的自我宣传的效果,使得更多的读者了解到我们馆以及我们馆的业务。还有门口广告机上的活动宣传、大厅出的检索资源查询等,都可以使得读者更加便捷、快速、准确的获取信息。
4.1建立可视化信息交互系统的重要性
若没有统一的发布管理平台,图书馆不同类型的资源与业务信息数据系统在发布信息过程中将会极其繁琐且低效。若因为终端不同,处理数据时便要跑几个地点,在几个不同的系统平台上进行相关数据或信息的发布,这样不仅浪费时间,因系统发布方式不尽相同,也会使发布过程就会变得冗长,继而影响效率。所以建立一套高效、便捷、扩展性好,可以跨平台推送和管理各种终端可视化信息交互系统就显的尤为重要。
4.2图书馆数据可视化信息交互系统的功能
根据图书馆的实际需求,图书馆可视化信息交互系统应当具有以下功能:①内容自动更新:内容库内容播放可根据指定频率自动更新到终端;多媒体格式支持:全面支持各种格式的多媒体素材,如音频、视频、图片、文字、动态数据等。②屏幕任意分区:屏幕可任意分区,同时播放播放多种内容;播放日程编排:可为每个终端定制播放日程表,终端自动播放对应内容。③分时分区播放:可任意设定内容的有效期、播放时段、播放地点。④简易内容制作:内容制作只需简单的拖放操作和参数设置即可完成,可以用模版。⑤实时消息插播:自定义消息样式、在指定终端底部滚动播出或全屏显示。⑥智能控制终端:终端按设定时间自动开关机、自动按日程表播放内容。⑦多种网络支持:基于TCP/IP协议传输、支持有线网络和无线网络。⑧终端远程管理:动态数据展现:终端可以自动展现图书馆动态服务信息,如新书通报、超期公告、到馆人数等;同时与文华统计系统对接,可任意展示统计系统内容。⑨系统统计功能:系统自带统计功能,用于统计交互终端返回信息,发布后台信息并提取展示。
5结语
大数据的挖掘与可视化的处理方式,给我们提供了一个资源整合与发现的机会,只要把握住,便能找出工作中的不足,完善自己的服务,为每一位读者揭示出对其最有价值的数据信息,并将这些信息呈现在读者眼前,只有读者满意对图书馆的服务满意,才能提高图书馆的社会效益。
参考文献:
[1]李小涛,邱均平等.论智慧图书馆与知识可视化[J].情报资料工作,2014(1):6-11.
[2]张霞.知识可视化研究综述[J].软件导刊(教育技术),2013(2):8-11.
[3]林小华.数字标牌在现代图书馆中的应用研究[J].图书馆工作与研究,2011(8):39-41.
作者简介:
莫穗明(1985—),男,本科学历,单位:广西壮族自治区图书馆。
关键词:公共图书馆;数据挖掘;可视化技术
“大数据”一词,最早由全球知名咨询公司麦肯锡提出,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产效率增长和消费者盈余的到来。“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而做出,而并非基于经验和直觉。搜索、买卖、产品制造等各种行为都有“大数据”的身影。数据挖掘是指通过统计分析从大量数据中提取隐藏于其中的规律,并用这些规律来预测未来或指导未来工作的科学。
1图书馆与数据挖掘
目前公共图书馆主要职能有:保存人类文化遗产、开展社会教育、传递科学情报、开发智力资源及提供文化娱乐的功能。其中开展社会教育、传递科学情报、开发智力资源等职能赋予了图书馆知识“搬运工”的身份,然而作为知识的“搬运工”,在“大数据”时代却遭遇到了前所未有的挑战。公共图书馆已经不再是过去的垄断时代中人们免费获取信息与知识的主要途径。Google、百度等搜索引擎成了越来越多人获取知识与信息查询时的第一选择。在这样一个趋势下,图书馆该何去何从?
公共图书馆提供的文化娱乐功能决定了其不仅是知识的“搬运工”,同时也是社会的“服务员”。作为“服务员”,如何更好的利用“大数据”时代的特点,为广大的读者提供更加高效、优质的服务也是十分值得公共图书馆探讨的。
2图书馆数据挖掘的必要性
大数据时代,一切都应以数据说话。图书馆的数据总体上分为两类:图书馆的资源与各业务系统数据。以广西壮族自治区图书馆为例,目前,广西壮族自治区图书馆现有的资源包括:馆藏实体书、电子书、商用数据库、自建地方特色数据库和八桂讲坛视频等。若能有效挖掘出各种资源之间的关联性、做好资源的自动揭示,有助于高效、便捷的给读者提供其最需要的资源,让其从中获得所需的知识,那么图书馆依然是知识的优秀“搬运工”。
Google、百度在很多小知识方面有优势,图书馆只要做好资源的揭示,就能提供的专业、系统和全面的知识给读者。同样以广西壮族自治区图书馆为例,广西壮族自治区图书馆现有各种业务系统包括:opac系统、rfid系统、统计分析系统、视频在线系统等。这些系统,每天都在收集大量的业务数据,通过对这些业务数据的挖掘与分析,可以有效找出我们服务中的优势与不足,从而提高服务质量及服务效率,充当好社会的“服务员”。一言以蔽之:做好对图书馆资源和各业务系统数据两方面的数据挖掘工作,是提升图书馆社会效益最佳途径。
3图书馆数据挖掘流程
数据挖掘的过程,一般而言可以分为三个阶段:数据准备、数据挖掘以及结果表达与解释。数据挖掘的方法包括:分类、聚类、关联、预测。比较合适资源揭示的是分类、聚类和关联,而合适各业务系统数据挖掘的是分类、关联和预测。
4图书馆数据的可视化
从上图可看出,可视化是数据挖掘的最后一步,也是数据的展示阶段。可视化(Visualization)指的是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。通俗地说,可视化是将数据图形化,使其更加符合人类本身对于事物的认知习惯,从可视化的定义不难看出,经过可视化处理的数据能达到准确、简单、直观、易于掌握的效果,可视化数据直观明了常人易于理解,因此,经过可视化后呈现的数据,可以反过来用于决策分析。
以广西壮族自治区图书馆为例,每个阅览室新到的图书,可以通过元数据的ISBN等字段与电子书封面的资源相匹配,在相应门口的读报机屏幕保护时展示封面给读者,同时使用时提供给读者在阅览室门口的读报机上查看并进行前十页的阅读,以增加读者对新文献的了解和兴趣。这里每个阅览口对应本阅览室的新书,实际上就是数据挖掘中的分类方法。当然,如果这些新书还进行了资源间的聚类,能关联到同类的资源,揭示的效果会更好。再如馆内的宣传片在大门处LED屏的播放,起到了很好的自我宣传的效果,使得更多的读者了解到我们馆以及我们馆的业务。还有门口广告机上的活动宣传、大厅出的检索资源查询等,都可以使得读者更加便捷、快速、准确的获取信息。
4.1建立可视化信息交互系统的重要性
若没有统一的发布管理平台,图书馆不同类型的资源与业务信息数据系统在发布信息过程中将会极其繁琐且低效。若因为终端不同,处理数据时便要跑几个地点,在几个不同的系统平台上进行相关数据或信息的发布,这样不仅浪费时间,因系统发布方式不尽相同,也会使发布过程就会变得冗长,继而影响效率。所以建立一套高效、便捷、扩展性好,可以跨平台推送和管理各种终端可视化信息交互系统就显的尤为重要。
4.2图书馆数据可视化信息交互系统的功能
根据图书馆的实际需求,图书馆可视化信息交互系统应当具有以下功能:①内容自动更新:内容库内容播放可根据指定频率自动更新到终端;多媒体格式支持:全面支持各种格式的多媒体素材,如音频、视频、图片、文字、动态数据等。②屏幕任意分区:屏幕可任意分区,同时播放播放多种内容;播放日程编排:可为每个终端定制播放日程表,终端自动播放对应内容。③分时分区播放:可任意设定内容的有效期、播放时段、播放地点。④简易内容制作:内容制作只需简单的拖放操作和参数设置即可完成,可以用模版。⑤实时消息插播:自定义消息样式、在指定终端底部滚动播出或全屏显示。⑥智能控制终端:终端按设定时间自动开关机、自动按日程表播放内容。⑦多种网络支持:基于TCP/IP协议传输、支持有线网络和无线网络。⑧终端远程管理:动态数据展现:终端可以自动展现图书馆动态服务信息,如新书通报、超期公告、到馆人数等;同时与文华统计系统对接,可任意展示统计系统内容。⑨系统统计功能:系统自带统计功能,用于统计交互终端返回信息,发布后台信息并提取展示。
5结语
大数据的挖掘与可视化的处理方式,给我们提供了一个资源整合与发现的机会,只要把握住,便能找出工作中的不足,完善自己的服务,为每一位读者揭示出对其最有价值的数据信息,并将这些信息呈现在读者眼前,只有读者满意对图书馆的服务满意,才能提高图书馆的社会效益。
参考文献:
[1]李小涛,邱均平等.论智慧图书馆与知识可视化[J].情报资料工作,2014(1):6-11.
[2]张霞.知识可视化研究综述[J].软件导刊(教育技术),2013(2):8-11.
[3]林小华.数字标牌在现代图书馆中的应用研究[J].图书馆工作与研究,2011(8):39-41.
作者简介:
莫穗明(1985—),男,本科学历,单位:广西壮族自治区图书馆。