基于大众分类法的分类法探析

来源 :昆明民族干部学院学报 | 被引量 : 0次 | 上传用户:mitsuaki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】大众分类法是基于用户参与的Web2.0而产生的一种新型的网络信息分类组织工具。本文通过分析大众分类法在图书情报学科的理论和实践价值,并以豆瓣读书的信息组织模式为例,探析大众分类法在数字环境实践中的应用分析,指出大众分类法具有自由灵活性、多维度揭示信息资源的特点,但同时也存在标签缺乏规范性、语法错误等缺点,由此对大众分类法在网络环境下的发展做进一步的思考。
  【关键词】大众分类法;信息组织;豆瓣网
  1.引言
  大众分类法(Folksonomy)是“一种由用户参与和主导的信息资源组织控制方式。”由网络信息用户根据自身对内容的理解自发为某类信息定义一组标签(Tag)进行描述,最终根据标签被使用的频率,选取高频标签作为该类信息类名的一种为网络信息分类的方法。这种分类方法强调一种“自下而上的”、“社会性的”、“用户共同创造的”的分类法,真正是以用户为中心,广泛用于博客、网络社区、图片及视频分享网站、数字图书馆等。
  2.大众分类法在图书情报学科的价值
  2.1信息分类法对图书情报学科建设的理论价值
  2.1.1突破传统分类法的思维框架
  分类法作为信息组织的重要方法之一,应对信息组织面临的新环境必然要突破传统分类法的思维框架,由重视信息的序化向重视用户的需求,注重人的认知和心理行为特点相结合的方向转变。网络信息分类法为分类法建设提供了一个全新的视角,并提出了更高的要求。在分类过程中,要求更加重视用户的需求,构建更加灵活和易用的分类体系。在继承图书情报学科的信息组织知识的基础上,更加强调以用户为中心,强调信息与用户的交互作用,让信息能够最大限度地为用户所利用。
  2.1.2深化图书情报学科的研究内容
  分类法的研究对象是信息的组织,其主旨是为了使信息可理解,使信息利用更加高效。网络环境下的信息分类的实质是通过对信息更加灵活的分类设计,帮助人们在网络环境中更有效地获取和利用信息。两者在最终目标上是异曲同工的。网络环境下的分众分类法本质便是通过自组织过程,满足部分网络用户需求的分类方式,促进了信息自组织理论的发展。因此,从网络信息分类法的视角研究图书情报学科领域的相关问题,既为图书情报学科领域增添新的内容,也必将会推动图书情报学科的理论和实践的深化和拓展。
  2.2信息分类法对图书情报学科的实践价值
  网络环境下的信息组织除了强调信息与信息之间的关系的揭示之外,还强调了信息与人的关系,人与信息的交互,人与人之间的关联,着重强调了以用户为中心的理论,按照用户的需求组织信息。这种对信息关系的理解和揭示促进了分类法在实践中的创新。在内容组织上,利用分类法和自动分类提高对网络环境下的信息的语义控制,结合传统分类法的优势,通过用户实现信息的自组织和资源共享,保证网络信息内容能有更完善的形式和更严密规范的语义关系。在网络层面上,通过深入分析信息之间的关系,对用户进行分类,从而帮助用户对信息之间的多维关系进行多维度理解,满足用户的多种需求,提高信息被利用的可能性。
  3.大众分类法在数字环境实践中的应用分析——以豆瓣读书为例
  在国外,已经有图书馆将大众分类法应用于图书馆的图书目录工作中,例如宾夕法尼亚州立大学图书馆所发展的PennTags服务,除了标签管理功能外,还提供用户对馆藏进行标记的功能。一些书籍共享网站也运用大众分类法,支持标签功能,让用户建立属于自己的书架,用户可以上传或导入符合 MARC 或者 DublinCore 格式的书籍数据。当用户建立了属于自己的书架,对书进行标签等操作后,网站就会向用户推荐可能感兴趣的书籍,社会化网络功能随之起作用。在国内,将大众分类法运用到数字图书馆的例子不多,比较典型的是厦门大学图书馆,除了对厦门大学学科博客添加标签之外,还在书目检索系统中设置了热门标签排行, 这些标签可以按照收藏排序, 也可以以云图方式进行可视化显示。此外,厦门大学图书馆系统支持用户进行标签搜索,注册用户也能自己为书添加标签。
  豆瓣网是“一個围绕“书”这一主题所建立的web2.0社交网站,核心是由用户所创建的“书+社会网络关系”。”作为国内最为典型的Web 2.0 网站,豆瓣网是应用大众分类法最成功的中文社区,通过标签的信息组织形式提供自下而上的信息分类等系统功能。本文将分析豆瓣读书的信息组织模式,探究大众分类法在豆瓣网上的运用,由此对分类法在网络环境下的发展做进一步的思考。
  3.1基于大众分类的豆瓣图书资源组织原理
  在豆瓣图书资源组织系统中,每一个标签记录了创建或使用了该标签的资源主体(一本图书)、用户主体(收藏该图书的用户)。系统通过对标签内部主体记录的分析,识别相同的标签识别,并统计出词频。由于资源主体和用户主体的内部状态中都有加标签的记录,当词频达到一定的阈值时,这个标签就会成为图书资源的一个标识;同时因为标签反映了用户的兴趣与知识,该标签也可以作为用户兴趣的一个标识。通过对标签的内涵分析和词频的统计,系统建立标签之间的关联,并以标签云的形式显示。系统基于复杂的标签广度聚合将体系中知识的内容结构与空间结构以标签间在知识环境中的可达语义距离为核心进行了整合描述,用户可以自主选择感兴趣的标签作为信息检索入口。
  豆瓣读书的每个标签都集合了多个信息项,系统具有动态发展的平级元数据词汇,能够支持元数据驱动的查询并记录用户的兴趣的变化,系统根据用户检索词,执行相应的标签推荐和图书馆推荐功能,将推荐结果返回给用户。 用户便可以结合系统的推荐,根据自身需求将相关资源进行收藏。
  此外,豆瓣系统还采用了标签统计、URL匹配统计的方法,对同一本图书被收藏的情况进行揭示。各个图书资源网页的相关数值时刻更新,具体数目和相关标签会被系统动态地反映在系统所提供的“豆瓣成员常用的标签”列表中。   豆瓣读书进行大众分类时运用的统计方法、关联规则、序列模式、聚类、分类方法、路径分析等一系列方法是实现网络环境下成功运用大众分类法的关键。其中,统计方法包括对各种标签数据的统计、如最频繁被标注的标签、资源的标签数量统计等。关联规则和序列模式作用相仿,用于发现用户之间、用户与标签之间以及被标注资源之间的潜在关系。聚类则主要用于将标签集合分成若干类或簇,是每个簇的数据点之间最大程度地相近,而不同簇中的数据点最大程度地相背离,从而发现标签信息的有效的语义内涵。分类方法可以为大众分类提供辅助,用于把标签、用户等核心概念设计的内容划分到不同类别中。路径分析则是用于对用户的标注行为所涵盖的一系列信息内容进行记录和跟踪,据此分析用户的习惯和爱好,从而将相关信息推荐给用户。
  3.2豆瓣读书的大众分类法运用实例
  在对图书资源进行收藏时,用户为图书添加的标签可以使用任意的非受控词汇,系统不会排斥任何词语表达,同时在页面底部有其他豆瓣成員对这本书常用的标签(按使用频次排列)供用户浏览选用,系统也会在底部也会向用户推荐相似读物。当用户下次再打开“读书”一栏时,豆瓣会根据用户的历史标签,豆瓣首页就会根据用户喜好推荐推荐相似标签的书籍。
  豆瓣网通过运用添加标签,为用户提供个性化的推荐系统。用户可以沿着小圈子找到大部队,发现许多与自身有相同兴趣爱好的人。而人与人的这种凭借兴趣的聚合,就会形成一种关系不固定却感情稳定的群体,在豆瓣网里表现为强大的小组功能。
  豆瓣读书的信息分类借鉴了传统分类法,在系统中人工设计了一定条目的基本标签类,对标签进行分类整理,豆瓣读书中的“分类浏览”中将标签分为六大类,然后再结合系统的“相关标签”引导用户使用和管理标签。
  4.豆瓣读书运用大众分类法的优缺点
  通过对豆瓣网案例分析可知,相对于传统分类法,大众分类法的标注形成过程体现了极大的自由灵活性。在豆瓣网上,用户可以自由选择标签对自身感兴趣的内容进行标识,提供一个或多个标签,或者只是单纯浏览他人的标签。因为不同用户对同一内容所添加的标签不同,如果用户认为标签不合适,可以自行添加新标签,突出体现了社会性共建共享的特点。而且大众分类法不同于分类目录和传统分类法,用户根据个人对内容的理解对信息进行标注,从多个维度揭示信息内容。
  但因为标签的随意性、标签垃圾等问题又给豆瓣网用户信息检索带来了极大的不便。大众分类法最大的问题就是标签缺乏一致性、常出现歧义、语法错误的问题。标签可能停留在粗浅的表层,而不做深入思考或精准描述。尤其当标签与系统固有分类维度重合的时候,就会失去价值。例如为豆瓣上的小说打上“小说”这个标签是毫无意义的。而且有人会为了让自己出现在搜索结果排在前列等而乱添加标签。大众分类法常常会出现拼写问题,除了拼错字词,英文里词组的分隔、大小写、单复数等就会造成大量混乱的标签。即使是同一个用户,也很有可能出现个人在同一系统中使用不一致的标签(如字面相异,意义相同等)来标注同一或相似内容。这必然导致大量污染性的垃圾标签,从而降低检索效率。
  5.结语
  自由随意性是大众分类法为用户管理信息资源带来的最大便利,系统通过为用户提供“常用标签”给用户推荐标签,建议用户优先选择系统推荐的高频标签来标注资源,但是系统并未能全面准确地自动识别资源内容,极易出现在语义上的交集,标签的专指度不高的问题。因此,大众分类法作为一种基于自然语言产生的新的网络信息组织方式,如何通过与其他信息组织方式相结合或借鉴其他信息组织方法的理念,提高大众分类法的实用性是大众分类法在网络环境下进一步发展急需解决的问题。
  参考文献:
  [1] 李玉芬.自由分类法与传统分类法在网络信息资源组织中的比较研究[J].农业图书情报学刊,2014,04.
  [2] 李慧美,陈朝晖,杨广锋.从豆瓣网看图书馆学科信息服务的改进[J].图书馆杂志,2009,08.
  [3] 陈朝.面向双维度标签语义聚合在Folksonomy导航架构研究[J].图书馆学研究,2015,13.
  [4] 罗琳,梁桂生,蔡军.基于分众分类法的图书馆书目推荐系统[J].图书馆学研究,2015,13.
  作者简介:谢兴梅,女,1989年3月,广东,硕士研究生,研究方向:图书馆信息服务和用户研究.
其他文献
近日,湖南省檔案局(馆)源源不断地接收到全省各地区、各单位报送的“湖南百姓家规家训档案”和“领导眼中的档案工作”微视频作品,国际档案日系列宣传活动取得初步成效。  4月初,省档案局(馆)按照国家档案局的统一部署,早筹划、早部署,及时下发通知,部署全省国际档案日宣传活动,重点开展“湖南百姓家规家训档案”和“领导眼中的档案工作”微视频征集两大主题活动。  “湖南百姓家规家训档案”征集活动,是全省档案系
期刊
【摘要】汉语数字成语在中华文化中起着非常重要的作用。英译好汉语数字成语有利于传播中国文化,但要准确地把它们译成英语不是件容易的事情。文章首先简要介绍了汉语数字成语,然后阐释了顺应论与翻译的关系,最后以顺应论为依据,通过举例探讨了汉语数字成语英译的直译、直译加解释、意译、转译的方法。  【关键词】顺应论;汉语数字成语;英译方法  一、汉语数字成语  汉语言中数字成语非常丰富,根据不完全数字统计,《中
期刊
【摘要】:在我国的消防部队灭火救援中,存在着装备落后、消防员实战能力差、安全防护意识不足等问题,导致了有时难以有效保证消防员、受灾者的人身安全,甚至导致严重人员伤亡。本文根据我国消防部队灭火救援安全现状,提出了有效了安全管理完善策略。  【关键词】消防部队;灭火救援;安全管理  我国诸多的火灾事故往往复杂多样,且破坏性极强,这就需要消防人员具有足够的实战经验和理论积累,可以根据火灾实际情况采取最佳
期刊
为更好地发挥档案服务中心、服务大局的独特作用,以强烈的文化意识推进伊通河综合治理的理念和决策,以实际行动服务伊通河改造工作,6月7日,长春市档案局馆联合市委办公厅举办了“伊通河往事”图片展。吉林省委常委、长春市委书记王君正,市委常委、秘书长赵明分别观看展览,展览吸引了众多党员干部驻足参观。  王君正饶有兴致地观看伊通河的每幅老照片,认真倾听讲解员讲述照片背后的故事。王君正连声赞“好”,称赞市档案局
期刊
近日,江苏省档案局馆召开纪念“6·9”国际档案日新闻发布会。省档案局馆长谢波等有关负责人在发布会上分别宣布:江苏省口述历史研究会成立;江苏省口述历史数据库建设正式启动;即日起,省档案馆向社会各界广泛征集散存在社会上,反映江苏地区各个历史时期发展情况的,对国家和社会有保存价值的档案资料。  发布会上,南京雨花台革命烈士纪念馆馆长向媛华、南京民间抗战博物馆馆长吴先斌向省档案馆移交了部分馆藏口述历史数据
期刊
【摘要】象征符号是一些用来提醒我们内在和外在之间、精神活动和物质表现之间的联系标志,以快速传递符号背后的信息。在藏地,随处可见藏传佛教的象征符号,这些符号成组成對出现,符号表达了藏传佛教对于世俗生活人们愿望与欲望的一种展现和对和谐生活的向往。  【关键字】藏传佛教象征符号;八瑞相;八瑞物 轮转王七政宝;七近宝;七珍宝;五妙欲 和谐四瑞  藏传佛教,或称藏语系佛教,又称为喇嘛教,是指传入西藏的佛教分
期刊
【摘要】我国的高等教育正处在转型时期,再加上国家正在大力推行职业教育,使得本科院校面临的压力和挑战逐步增加,这就要求本科院校需要全面分析新形势下学生管理工作的现实需要,全面创新管理工作思路,优化管理手段,提高管理质量和水平,培养综合素质高和符合社会以及企业需求的人才。本科院校要充分认识到进一步强化和创新学生管理工作的重要性和必要性,并在具体管理工作当中加强实践和分析总结,形成一套完善的学生管理工作
期刊
6月9日,北京市档案馆开展了“国际档案日”暨北京市第九届“档案馆日”活动。当天,市档案馆召开了档案法制动漫《档案连着你我他》发布会。国家档案局有关领导及市档案局领导和工作人员,以及广大参观者参加了发布仪式。  北京市档案馆在该天的活动中还面向社会推出“通衢之州 大美新城——魅力副中心”展览、推出馆藏档案专题片——《北京记忆·馆藏映像》、开展非物质文化遗产展示、向社会公众开放特藏库、档案知识竞赛、推
期刊
为做好2017年全国档案专家选拔工作,推进档案专业人才队伍建设,6月7日,国家档案局在北京组织召开了全国档案专家选拔工作部署会议。国家档案局办公室主任李勤在会上传达了国家档案局局长李明华关于启动全国档案专家选拔工作的讲话。会议着重介绍了全国档案专家选拔和培养工作安排,并就相关问题进行了说明。  李明华在讲话中指出,开展全国档案专家选拔与培养工作,目的是深入贯彻落实中办、国办《关于加强和改进新形势下
期刊
【摘要】本文对机械设计进行了详细的介绍,分析了机械设计程序,阐述了机械设计优化的重要性,并对ACO算法的机械设计优化方法进行研究,以供参考。  【关键词】ACO算法;机械设计;优化  1 机械设计概述  1.1 机械设计的基本思路  机械设计中采用的参数与零部件应尽量保证标准化、系列化以及通用化,也就是“三化”,如此可以使设计工作量得到有效减小,使生产周期得以缩短,增强互换性,实现对制造成本的有效
期刊