论文部分内容阅读
【摘要】大众分类法是基于用户参与的Web2.0而产生的一种新型的网络信息分类组织工具。本文通过分析大众分类法在图书情报学科的理论和实践价值,并以豆瓣读书的信息组织模式为例,探析大众分类法在数字环境实践中的应用分析,指出大众分类法具有自由灵活性、多维度揭示信息资源的特点,但同时也存在标签缺乏规范性、语法错误等缺点,由此对大众分类法在网络环境下的发展做进一步的思考。
【关键词】大众分类法;信息组织;豆瓣网
1.引言
大众分类法(Folksonomy)是“一种由用户参与和主导的信息资源组织控制方式。”由网络信息用户根据自身对内容的理解自发为某类信息定义一组标签(Tag)进行描述,最终根据标签被使用的频率,选取高频标签作为该类信息类名的一种为网络信息分类的方法。这种分类方法强调一种“自下而上的”、“社会性的”、“用户共同创造的”的分类法,真正是以用户为中心,广泛用于博客、网络社区、图片及视频分享网站、数字图书馆等。
2.大众分类法在图书情报学科的价值
2.1信息分类法对图书情报学科建设的理论价值
2.1.1突破传统分类法的思维框架
分类法作为信息组织的重要方法之一,应对信息组织面临的新环境必然要突破传统分类法的思维框架,由重视信息的序化向重视用户的需求,注重人的认知和心理行为特点相结合的方向转变。网络信息分类法为分类法建设提供了一个全新的视角,并提出了更高的要求。在分类过程中,要求更加重视用户的需求,构建更加灵活和易用的分类体系。在继承图书情报学科的信息组织知识的基础上,更加强调以用户为中心,强调信息与用户的交互作用,让信息能够最大限度地为用户所利用。
2.1.2深化图书情报学科的研究内容
分类法的研究对象是信息的组织,其主旨是为了使信息可理解,使信息利用更加高效。网络环境下的信息分类的实质是通过对信息更加灵活的分类设计,帮助人们在网络环境中更有效地获取和利用信息。两者在最终目标上是异曲同工的。网络环境下的分众分类法本质便是通过自组织过程,满足部分网络用户需求的分类方式,促进了信息自组织理论的发展。因此,从网络信息分类法的视角研究图书情报学科领域的相关问题,既为图书情报学科领域增添新的内容,也必将会推动图书情报学科的理论和实践的深化和拓展。
2.2信息分类法对图书情报学科的实践价值
网络环境下的信息组织除了强调信息与信息之间的关系的揭示之外,还强调了信息与人的关系,人与信息的交互,人与人之间的关联,着重强调了以用户为中心的理论,按照用户的需求组织信息。这种对信息关系的理解和揭示促进了分类法在实践中的创新。在内容组织上,利用分类法和自动分类提高对网络环境下的信息的语义控制,结合传统分类法的优势,通过用户实现信息的自组织和资源共享,保证网络信息内容能有更完善的形式和更严密规范的语义关系。在网络层面上,通过深入分析信息之间的关系,对用户进行分类,从而帮助用户对信息之间的多维关系进行多维度理解,满足用户的多种需求,提高信息被利用的可能性。
3.大众分类法在数字环境实践中的应用分析——以豆瓣读书为例
在国外,已经有图书馆将大众分类法应用于图书馆的图书目录工作中,例如宾夕法尼亚州立大学图书馆所发展的PennTags服务,除了标签管理功能外,还提供用户对馆藏进行标记的功能。一些书籍共享网站也运用大众分类法,支持标签功能,让用户建立属于自己的书架,用户可以上传或导入符合 MARC 或者 DublinCore 格式的书籍数据。当用户建立了属于自己的书架,对书进行标签等操作后,网站就会向用户推荐可能感兴趣的书籍,社会化网络功能随之起作用。在国内,将大众分类法运用到数字图书馆的例子不多,比较典型的是厦门大学图书馆,除了对厦门大学学科博客添加标签之外,还在书目检索系统中设置了热门标签排行, 这些标签可以按照收藏排序, 也可以以云图方式进行可视化显示。此外,厦门大学图书馆系统支持用户进行标签搜索,注册用户也能自己为书添加标签。
豆瓣网是“一個围绕“书”这一主题所建立的web2.0社交网站,核心是由用户所创建的“书+社会网络关系”。”作为国内最为典型的Web 2.0 网站,豆瓣网是应用大众分类法最成功的中文社区,通过标签的信息组织形式提供自下而上的信息分类等系统功能。本文将分析豆瓣读书的信息组织模式,探究大众分类法在豆瓣网上的运用,由此对分类法在网络环境下的发展做进一步的思考。
3.1基于大众分类的豆瓣图书资源组织原理
在豆瓣图书资源组织系统中,每一个标签记录了创建或使用了该标签的资源主体(一本图书)、用户主体(收藏该图书的用户)。系统通过对标签内部主体记录的分析,识别相同的标签识别,并统计出词频。由于资源主体和用户主体的内部状态中都有加标签的记录,当词频达到一定的阈值时,这个标签就会成为图书资源的一个标识;同时因为标签反映了用户的兴趣与知识,该标签也可以作为用户兴趣的一个标识。通过对标签的内涵分析和词频的统计,系统建立标签之间的关联,并以标签云的形式显示。系统基于复杂的标签广度聚合将体系中知识的内容结构与空间结构以标签间在知识环境中的可达语义距离为核心进行了整合描述,用户可以自主选择感兴趣的标签作为信息检索入口。
豆瓣读书的每个标签都集合了多个信息项,系统具有动态发展的平级元数据词汇,能够支持元数据驱动的查询并记录用户的兴趣的变化,系统根据用户检索词,执行相应的标签推荐和图书馆推荐功能,将推荐结果返回给用户。 用户便可以结合系统的推荐,根据自身需求将相关资源进行收藏。
此外,豆瓣系统还采用了标签统计、URL匹配统计的方法,对同一本图书被收藏的情况进行揭示。各个图书资源网页的相关数值时刻更新,具体数目和相关标签会被系统动态地反映在系统所提供的“豆瓣成员常用的标签”列表中。 豆瓣读书进行大众分类时运用的统计方法、关联规则、序列模式、聚类、分类方法、路径分析等一系列方法是实现网络环境下成功运用大众分类法的关键。其中,统计方法包括对各种标签数据的统计、如最频繁被标注的标签、资源的标签数量统计等。关联规则和序列模式作用相仿,用于发现用户之间、用户与标签之间以及被标注资源之间的潜在关系。聚类则主要用于将标签集合分成若干类或簇,是每个簇的数据点之间最大程度地相近,而不同簇中的数据点最大程度地相背离,从而发现标签信息的有效的语义内涵。分类方法可以为大众分类提供辅助,用于把标签、用户等核心概念设计的内容划分到不同类别中。路径分析则是用于对用户的标注行为所涵盖的一系列信息内容进行记录和跟踪,据此分析用户的习惯和爱好,从而将相关信息推荐给用户。
3.2豆瓣读书的大众分类法运用实例
在对图书资源进行收藏时,用户为图书添加的标签可以使用任意的非受控词汇,系统不会排斥任何词语表达,同时在页面底部有其他豆瓣成員对这本书常用的标签(按使用频次排列)供用户浏览选用,系统也会在底部也会向用户推荐相似读物。当用户下次再打开“读书”一栏时,豆瓣会根据用户的历史标签,豆瓣首页就会根据用户喜好推荐推荐相似标签的书籍。
豆瓣网通过运用添加标签,为用户提供个性化的推荐系统。用户可以沿着小圈子找到大部队,发现许多与自身有相同兴趣爱好的人。而人与人的这种凭借兴趣的聚合,就会形成一种关系不固定却感情稳定的群体,在豆瓣网里表现为强大的小组功能。
豆瓣读书的信息分类借鉴了传统分类法,在系统中人工设计了一定条目的基本标签类,对标签进行分类整理,豆瓣读书中的“分类浏览”中将标签分为六大类,然后再结合系统的“相关标签”引导用户使用和管理标签。
4.豆瓣读书运用大众分类法的优缺点
通过对豆瓣网案例分析可知,相对于传统分类法,大众分类法的标注形成过程体现了极大的自由灵活性。在豆瓣网上,用户可以自由选择标签对自身感兴趣的内容进行标识,提供一个或多个标签,或者只是单纯浏览他人的标签。因为不同用户对同一内容所添加的标签不同,如果用户认为标签不合适,可以自行添加新标签,突出体现了社会性共建共享的特点。而且大众分类法不同于分类目录和传统分类法,用户根据个人对内容的理解对信息进行标注,从多个维度揭示信息内容。
但因为标签的随意性、标签垃圾等问题又给豆瓣网用户信息检索带来了极大的不便。大众分类法最大的问题就是标签缺乏一致性、常出现歧义、语法错误的问题。标签可能停留在粗浅的表层,而不做深入思考或精准描述。尤其当标签与系统固有分类维度重合的时候,就会失去价值。例如为豆瓣上的小说打上“小说”这个标签是毫无意义的。而且有人会为了让自己出现在搜索结果排在前列等而乱添加标签。大众分类法常常会出现拼写问题,除了拼错字词,英文里词组的分隔、大小写、单复数等就会造成大量混乱的标签。即使是同一个用户,也很有可能出现个人在同一系统中使用不一致的标签(如字面相异,意义相同等)来标注同一或相似内容。这必然导致大量污染性的垃圾标签,从而降低检索效率。
5.结语
自由随意性是大众分类法为用户管理信息资源带来的最大便利,系统通过为用户提供“常用标签”给用户推荐标签,建议用户优先选择系统推荐的高频标签来标注资源,但是系统并未能全面准确地自动识别资源内容,极易出现在语义上的交集,标签的专指度不高的问题。因此,大众分类法作为一种基于自然语言产生的新的网络信息组织方式,如何通过与其他信息组织方式相结合或借鉴其他信息组织方法的理念,提高大众分类法的实用性是大众分类法在网络环境下进一步发展急需解决的问题。
参考文献:
[1] 李玉芬.自由分类法与传统分类法在网络信息资源组织中的比较研究[J].农业图书情报学刊,2014,04.
[2] 李慧美,陈朝晖,杨广锋.从豆瓣网看图书馆学科信息服务的改进[J].图书馆杂志,2009,08.
[3] 陈朝.面向双维度标签语义聚合在Folksonomy导航架构研究[J].图书馆学研究,2015,13.
[4] 罗琳,梁桂生,蔡军.基于分众分类法的图书馆书目推荐系统[J].图书馆学研究,2015,13.
作者简介:谢兴梅,女,1989年3月,广东,硕士研究生,研究方向:图书馆信息服务和用户研究.
【关键词】大众分类法;信息组织;豆瓣网
1.引言
大众分类法(Folksonomy)是“一种由用户参与和主导的信息资源组织控制方式。”由网络信息用户根据自身对内容的理解自发为某类信息定义一组标签(Tag)进行描述,最终根据标签被使用的频率,选取高频标签作为该类信息类名的一种为网络信息分类的方法。这种分类方法强调一种“自下而上的”、“社会性的”、“用户共同创造的”的分类法,真正是以用户为中心,广泛用于博客、网络社区、图片及视频分享网站、数字图书馆等。
2.大众分类法在图书情报学科的价值
2.1信息分类法对图书情报学科建设的理论价值
2.1.1突破传统分类法的思维框架
分类法作为信息组织的重要方法之一,应对信息组织面临的新环境必然要突破传统分类法的思维框架,由重视信息的序化向重视用户的需求,注重人的认知和心理行为特点相结合的方向转变。网络信息分类法为分类法建设提供了一个全新的视角,并提出了更高的要求。在分类过程中,要求更加重视用户的需求,构建更加灵活和易用的分类体系。在继承图书情报学科的信息组织知识的基础上,更加强调以用户为中心,强调信息与用户的交互作用,让信息能够最大限度地为用户所利用。
2.1.2深化图书情报学科的研究内容
分类法的研究对象是信息的组织,其主旨是为了使信息可理解,使信息利用更加高效。网络环境下的信息分类的实质是通过对信息更加灵活的分类设计,帮助人们在网络环境中更有效地获取和利用信息。两者在最终目标上是异曲同工的。网络环境下的分众分类法本质便是通过自组织过程,满足部分网络用户需求的分类方式,促进了信息自组织理论的发展。因此,从网络信息分类法的视角研究图书情报学科领域的相关问题,既为图书情报学科领域增添新的内容,也必将会推动图书情报学科的理论和实践的深化和拓展。
2.2信息分类法对图书情报学科的实践价值
网络环境下的信息组织除了强调信息与信息之间的关系的揭示之外,还强调了信息与人的关系,人与信息的交互,人与人之间的关联,着重强调了以用户为中心的理论,按照用户的需求组织信息。这种对信息关系的理解和揭示促进了分类法在实践中的创新。在内容组织上,利用分类法和自动分类提高对网络环境下的信息的语义控制,结合传统分类法的优势,通过用户实现信息的自组织和资源共享,保证网络信息内容能有更完善的形式和更严密规范的语义关系。在网络层面上,通过深入分析信息之间的关系,对用户进行分类,从而帮助用户对信息之间的多维关系进行多维度理解,满足用户的多种需求,提高信息被利用的可能性。
3.大众分类法在数字环境实践中的应用分析——以豆瓣读书为例
在国外,已经有图书馆将大众分类法应用于图书馆的图书目录工作中,例如宾夕法尼亚州立大学图书馆所发展的PennTags服务,除了标签管理功能外,还提供用户对馆藏进行标记的功能。一些书籍共享网站也运用大众分类法,支持标签功能,让用户建立属于自己的书架,用户可以上传或导入符合 MARC 或者 DublinCore 格式的书籍数据。当用户建立了属于自己的书架,对书进行标签等操作后,网站就会向用户推荐可能感兴趣的书籍,社会化网络功能随之起作用。在国内,将大众分类法运用到数字图书馆的例子不多,比较典型的是厦门大学图书馆,除了对厦门大学学科博客添加标签之外,还在书目检索系统中设置了热门标签排行, 这些标签可以按照收藏排序, 也可以以云图方式进行可视化显示。此外,厦门大学图书馆系统支持用户进行标签搜索,注册用户也能自己为书添加标签。
豆瓣网是“一個围绕“书”这一主题所建立的web2.0社交网站,核心是由用户所创建的“书+社会网络关系”。”作为国内最为典型的Web 2.0 网站,豆瓣网是应用大众分类法最成功的中文社区,通过标签的信息组织形式提供自下而上的信息分类等系统功能。本文将分析豆瓣读书的信息组织模式,探究大众分类法在豆瓣网上的运用,由此对分类法在网络环境下的发展做进一步的思考。
3.1基于大众分类的豆瓣图书资源组织原理
在豆瓣图书资源组织系统中,每一个标签记录了创建或使用了该标签的资源主体(一本图书)、用户主体(收藏该图书的用户)。系统通过对标签内部主体记录的分析,识别相同的标签识别,并统计出词频。由于资源主体和用户主体的内部状态中都有加标签的记录,当词频达到一定的阈值时,这个标签就会成为图书资源的一个标识;同时因为标签反映了用户的兴趣与知识,该标签也可以作为用户兴趣的一个标识。通过对标签的内涵分析和词频的统计,系统建立标签之间的关联,并以标签云的形式显示。系统基于复杂的标签广度聚合将体系中知识的内容结构与空间结构以标签间在知识环境中的可达语义距离为核心进行了整合描述,用户可以自主选择感兴趣的标签作为信息检索入口。
豆瓣读书的每个标签都集合了多个信息项,系统具有动态发展的平级元数据词汇,能够支持元数据驱动的查询并记录用户的兴趣的变化,系统根据用户检索词,执行相应的标签推荐和图书馆推荐功能,将推荐结果返回给用户。 用户便可以结合系统的推荐,根据自身需求将相关资源进行收藏。
此外,豆瓣系统还采用了标签统计、URL匹配统计的方法,对同一本图书被收藏的情况进行揭示。各个图书资源网页的相关数值时刻更新,具体数目和相关标签会被系统动态地反映在系统所提供的“豆瓣成员常用的标签”列表中。 豆瓣读书进行大众分类时运用的统计方法、关联规则、序列模式、聚类、分类方法、路径分析等一系列方法是实现网络环境下成功运用大众分类法的关键。其中,统计方法包括对各种标签数据的统计、如最频繁被标注的标签、资源的标签数量统计等。关联规则和序列模式作用相仿,用于发现用户之间、用户与标签之间以及被标注资源之间的潜在关系。聚类则主要用于将标签集合分成若干类或簇,是每个簇的数据点之间最大程度地相近,而不同簇中的数据点最大程度地相背离,从而发现标签信息的有效的语义内涵。分类方法可以为大众分类提供辅助,用于把标签、用户等核心概念设计的内容划分到不同类别中。路径分析则是用于对用户的标注行为所涵盖的一系列信息内容进行记录和跟踪,据此分析用户的习惯和爱好,从而将相关信息推荐给用户。
3.2豆瓣读书的大众分类法运用实例
在对图书资源进行收藏时,用户为图书添加的标签可以使用任意的非受控词汇,系统不会排斥任何词语表达,同时在页面底部有其他豆瓣成員对这本书常用的标签(按使用频次排列)供用户浏览选用,系统也会在底部也会向用户推荐相似读物。当用户下次再打开“读书”一栏时,豆瓣会根据用户的历史标签,豆瓣首页就会根据用户喜好推荐推荐相似标签的书籍。
豆瓣网通过运用添加标签,为用户提供个性化的推荐系统。用户可以沿着小圈子找到大部队,发现许多与自身有相同兴趣爱好的人。而人与人的这种凭借兴趣的聚合,就会形成一种关系不固定却感情稳定的群体,在豆瓣网里表现为强大的小组功能。
豆瓣读书的信息分类借鉴了传统分类法,在系统中人工设计了一定条目的基本标签类,对标签进行分类整理,豆瓣读书中的“分类浏览”中将标签分为六大类,然后再结合系统的“相关标签”引导用户使用和管理标签。
4.豆瓣读书运用大众分类法的优缺点
通过对豆瓣网案例分析可知,相对于传统分类法,大众分类法的标注形成过程体现了极大的自由灵活性。在豆瓣网上,用户可以自由选择标签对自身感兴趣的内容进行标识,提供一个或多个标签,或者只是单纯浏览他人的标签。因为不同用户对同一内容所添加的标签不同,如果用户认为标签不合适,可以自行添加新标签,突出体现了社会性共建共享的特点。而且大众分类法不同于分类目录和传统分类法,用户根据个人对内容的理解对信息进行标注,从多个维度揭示信息内容。
但因为标签的随意性、标签垃圾等问题又给豆瓣网用户信息检索带来了极大的不便。大众分类法最大的问题就是标签缺乏一致性、常出现歧义、语法错误的问题。标签可能停留在粗浅的表层,而不做深入思考或精准描述。尤其当标签与系统固有分类维度重合的时候,就会失去价值。例如为豆瓣上的小说打上“小说”这个标签是毫无意义的。而且有人会为了让自己出现在搜索结果排在前列等而乱添加标签。大众分类法常常会出现拼写问题,除了拼错字词,英文里词组的分隔、大小写、单复数等就会造成大量混乱的标签。即使是同一个用户,也很有可能出现个人在同一系统中使用不一致的标签(如字面相异,意义相同等)来标注同一或相似内容。这必然导致大量污染性的垃圾标签,从而降低检索效率。
5.结语
自由随意性是大众分类法为用户管理信息资源带来的最大便利,系统通过为用户提供“常用标签”给用户推荐标签,建议用户优先选择系统推荐的高频标签来标注资源,但是系统并未能全面准确地自动识别资源内容,极易出现在语义上的交集,标签的专指度不高的问题。因此,大众分类法作为一种基于自然语言产生的新的网络信息组织方式,如何通过与其他信息组织方式相结合或借鉴其他信息组织方法的理念,提高大众分类法的实用性是大众分类法在网络环境下进一步发展急需解决的问题。
参考文献:
[1] 李玉芬.自由分类法与传统分类法在网络信息资源组织中的比较研究[J].农业图书情报学刊,2014,04.
[2] 李慧美,陈朝晖,杨广锋.从豆瓣网看图书馆学科信息服务的改进[J].图书馆杂志,2009,08.
[3] 陈朝.面向双维度标签语义聚合在Folksonomy导航架构研究[J].图书馆学研究,2015,13.
[4] 罗琳,梁桂生,蔡军.基于分众分类法的图书馆书目推荐系统[J].图书馆学研究,2015,13.
作者简介:谢兴梅,女,1989年3月,广东,硕士研究生,研究方向:图书馆信息服务和用户研究.