论文部分内容阅读
摘要:Web2.0下的用户生成内容对旅游决策的影响力越来越大,新型Web2.0微博上的旅游信息特性是值得研究的。文章通过新浪微博对游客产生内容进行统计分析,分别从信息来源、评论数和转载数、时间、空间以及多媒体特性等五个维度对它进行探讨,得出微博上用户生成内容的特性。
关键词:新浪微博;用户生成内容;旅游信息
一、引言
用户生成内容(UserGeneratedContent)是Web2.0时代下的产物,它极大丰富了互联网内容,对用户决策产生了深远的影响。旅游者生成内容(TouristCreatedContent)是UCG的一种,是游客在Internet上创建的具有一定创新性的,公开可用的内容。它包含了旅游的各个方面,极大丰富了旅游信息的内容,超过74.3%的在线旅游者利用TCC进行旅游决策,其每年产生的价值超过了100亿美元,对旅游产业产生的重大影响。目前利用TCC进行运营的应用网站包括了大众点评网,孤独星球。这些网站依靠用户生成内容,创造了极大的旅游信息源和利润。UGC所具有的去中心化,动态等特点是原本Web1.0时代下所不具有的,Web2.0上的去中心化的内容让每一个用户都可能成为信息平台的主角,使得用户之间的互动增加。这些特点正是UGC所带来的改变,也推进互联网发展到新的发展阶段。
新浪微博是一个由新浪网推出,由用户通过电脑、移动终端、IM等多种途径随时随地的发布文字信息(不超过140个字)、图片和视频信息的一种网络模式。您的粉丝可以第一时间看到你发表的信息和内容。您还可以关注您的粉丝,可以即时看到他们所发布的信息。据调查统计,新浪微博的用户现在已经超过1亿,其影响力大大增加,而在用户生成内容中,其中的40%都是和旅游相关的信息,其信息的特性值得进行研究。
二、研究方法
(一)样本数据来源
所有用于分析的样本都从新浪微博上获得,为了获得一个完全随机的微博样本,笔者通过RSS源来抓取关于旅游的微博信息。因为微博上有广大的信息源,只有很小一部分真正受到用户的关注,为了使数据更有说服力,选取了其中具有热门标签的500条微博进行分析,每个旅游微博包括了发送者名称、发送时间、类别、评论和转载数等结构要素。
(二)数据处理和研究方法
由于原始的数据较为杂乱和不规则,除了按照上面要求进行整理外,还对部分进行筛选,利用统计学中的基本方法对数据的特征进行归类分析,对未来的可能进行推断和预测。利用文本分析法,对旅游信息文本中的时间,空间以及多媒体进行分析。在数据分析和处理的过程中运用EXCEL工具辅助处理。
三、结果与讨论
(一)信息来源
根据发送者的身份,本文把微博上旅游信息发送者分为普通用户、旅游企业、管理机构三类。普通用户在微博平台上主要是创造原创内容,浏览旅游信息,旅游咨询和旅游信息搜索。微博上的旅游信息对游客产生了越来越大的影响。旅游企业,主要是对旅游产品进行营销,旅游攻略和解答用户的疑问等,一条关注度较高的微博在互联网及与之关联的手机WAP平台上发出后短时间内互动性转发就可以抵达微博世界的每一个角落,达到短时间内最多的目击人数。旅游部门主要是对地方性旅游进行宣传与通告等。旅游部门与民众直接联系和交流,民众能充分了解旅游部门工作运转,通过微博这样一个迥异于官方文件的形式,沟通和交流更加变捷。
结果显示普通用户的比例54%。旅游企业的比例32%.旅游部门14%.普通用户占了一半以上,说明了普通用户产生的信息内容起到了决定性的作用。是因为微博上的用户绝大部分是关于旅游的记录,是个性化的信息。普通的用户对分享旅游信息具有巨大的热情,而旅游企业和旅游机构对微博营销和宣传刚刚开始,造成了比起普通用户信息较少,且普通用户的人群基数也比企业和机构大的多。除了分析样本的来源外,还对样本的主题领域进行了类别的区别,主要是分为了目的地信息,交通信息,住宿信息,餐饮信息,行程安排,旅游安全信息五类,并对他们进行分析,各类旅游信息中,发现了普通用户发送的各类旅游微博都占了50%以上,因此说明,微博给了普通用户真正的话语权,在上面发送的信息大部分都是普通用户发送的,给了每个游客创造了发送和分享旅游信息的平台。从以上几个方面可以看出,新浪微博实现了他的口号,“随时随地分享新鲜事”,使得用户在产生旅游信息的同时,构建了自己的个性化平台。从视频类别比例图中可以看出目的地信息,住宿信息,餐饮信息占了样本数的80%,交通信息等占了20%左右。由此可以看出,用户偏重于对目的地的信息分享。但对交通等信息产生过少,这就需要合理引导游客产生的内容,全面为游客服务。
(二)评论数和转载数的分析
在微博用户创造信息内容的同时,评论数和转载数是社会网络中一个非常重要的指标。用户对一条微博的评论和转载反映了对该微博的关注程度。表3中显示了抓取到的最受欢迎的300条三种不同创作类型的视频评论数和转载数的最大值、最小值、评论数和转载数之和大于100,从统计中发现普通用户发送的评论很少,最多的只有1180条,且都是用户之间好友的评论。而旅游企业的评论数最多的为11118,可能原因是旅游企业发送的微博应用较为广泛。所包含的信息内容和质量较高。符合了用户对信息产生兴趣的习惯。在旅游企业的微博中,大于500条微博数占了80%,远远大于普通的用户的5.8%,旅游企业虽然创造的内容比较少,但其关注程度远远大于普通用户,这也说明了旅游企业创造的内容质量相对较高,受欢迎程度较大。普通用户创造内容的特点很大一部分是家庭成员与朋友间的分享,因此他的评论数可能会受到一定的限制。由于微博的内容数量非常庞大,更新速度太过频繁,因此相关的搜索过程也较为困难,对普通用户容易产生认知偏差或者认知负荷等问题。其实一些受冷落的信息内容也很高的质量。这些微博内容不能产生影响的话,会造成资源上巨大的损失。
(三)时间特征
通过对微博内容的分析统计,旅游微博上通常时间表示的词汇为:历史、今天、现在、梦想、将来、记得、如今、打算等词汇。在500条微博中,带有时间的意思表示将近430条,表明人们在微博平台上旅游信息有较强的时间特征。对含有时间表示的词汇进行统计,表示对现在旅游情况表示的词汇如今天,现在,正在等一共是325条微博信息,说明微博上的旅游信息是游客对于旅游的实时分享。对这些信息进行分时间段的统计,发现9:00-11:00,14:00-16:00之间所发送的旅游景区的信息比较多,多是一些感叹词加上少量图片旅游信息。11:00-14:00之间发送的美食旅游信息占了大部分。18:00-22:00之间住宿,酒店,饮食的信息较多,在一定程度上说明微博发表的信息是用户对现在旅游状况的表示。整体来说,通过对时间特征的微博内容分析表明,实时是旅游微博的重要信息特征。总结其原因是手机微博的“轻灵快”的特点造成的。
(四)空间特征
微博上的空间信息是我们利用微博的重要特征,是进行旅游微博信息归类的基础影响因素。通过对微博内容的空间特征进行分析,我们得出了以下的空间特点。在统计的500条微博上,有空间表示的占了428条,表明用户在微博内容上也具有较强的空间地理观念,微博上的空间表示主要分为国内和国外微博信息:微博上对国外旅游描述通常是整体的介绍,微博上的旅游信息的空间地点介绍通常是国外旅游的热点如:西班牙,英国,日本,美国等,对国外历史和现在的评价较多,通常表现为风土人情的介绍和国外风情。这些信息通常是旅游营销和旅游宣传发送的旅游信息,转载和评论相对较多,用户通常是表示对国外旅游的向往如我想去,计划去等,说明国外旅游对用户有较大的吸引力。微博上信息对国内则是某个景点或者景区局部的介绍,对国内微博的旅游信息多表现为景区的服务评价和自然风光。国内的热点通常是海南,北京,上海等著名的景区,用户对国内景点的评价较少,表现为旅游向往的较少,且通常评价的是只是好友之间的互动。整体来说,微博旅游信息有空间表述的较多,且涉及的空间地理信息较多,通过科学的归类,这些信息可以被我们所用。这些空间地理特征,表明了用户的实施实时的旅游位置,统计信息抓取的地理位置,有利于我们进行统计分析。并且表明了旅游者消费的地域,便于进行网络营销。
(五)多媒体信息特征
多媒体信息是我们对微博内容考查的重要一环。多媒体信息对用户的影响较大,这里影响较大时是指转载和评价的概率相对纯文字信息来说。多媒体发布时,使得用户得到的信息信息更多,通常发布多媒体信息的评论和转发的就较多。对500条微博信息的多媒体信息进行统计,有多媒体信息的微博占了将近五层,发送的多媒体信息多为漂亮的自然风光和景色,用户发表图片时通常发布和自己相关的多媒体信息,把自己或者朋友放在多媒体中,一定程度表明了对微博的信任及其准确性。发的多媒体信息多为发送微博的多媒体信息终端通常是电脑,占了有多媒体特征的70%左右,表明手机3G网络还在发展之中,需要手机3G网络的进一步发展和普及。
四、结束语
本文得出以下结论:
第一,在微博的旅游信息中,发送的量最大的为普通用户,是主要的信息来源。旅游企业和旅游部门发送的信息呈现上升趋势。这些用户都乐于分享自己所了解的信息。发送目的地、住宿、餐饮信息等相关信息最多。这些特征表现为用户对这些信息的了解相对较多。而这些信息又是旅游信息内容的关键信息,需要制度来对信息内容进行合理的引导。
第二,由于受浏览对象的限制和发送信息的规范性等因素的影响,旅游企业和旅游部门发送的微博转载率和评论率较多,其影响力较大。
第三,微博旅游信息具有实时性,是对现在旅游情况的描述。
第四,包含的空间地理位置很多,但是分类却非常散乱。包含多媒体信息的微博影响更大,因为其形式更显活泼和真实性,另外3G网络更待需要发展,为实时分享奠定基础。除了信息的质量问题外,旅游服务实时信息是来源多样、高度异质化,碎片化的信息。由各种人员(包括专业人员和非专业人员)通过手机收集和创建的,这样就造成了信息提取难度较大。需要对TCC内容进行合理的分类以及建立相应的制度设计,为信息的提取做好准备。
参考文献:
1、Puri,A.The web of insights:The art and practice of webnography[J].International Journal of Market Research, 2007(3).
2、汪婷,陆林.基于博客的旅游研究信息的提取与分析[J].旅游论坛,2010(8).
3、陈欣,朱庆华,赵宇翔.基于YouTube的视频网站用户生成内容的特性分析[J].图书馆杂志,2009(9).
4、Beaumont,C.Tweet,Tweet,Here Comes Twitter[J].The Telegraph,2008(4).
5、Gretzel,Yoo,K.Use and impact of online travel reviews[D].In P.O’Connor,2008.
(作者单位:重庆理工大学工商管理学院)
关键词:新浪微博;用户生成内容;旅游信息
一、引言
用户生成内容(UserGeneratedContent)是Web2.0时代下的产物,它极大丰富了互联网内容,对用户决策产生了深远的影响。旅游者生成内容(TouristCreatedContent)是UCG的一种,是游客在Internet上创建的具有一定创新性的,公开可用的内容。它包含了旅游的各个方面,极大丰富了旅游信息的内容,超过74.3%的在线旅游者利用TCC进行旅游决策,其每年产生的价值超过了100亿美元,对旅游产业产生的重大影响。目前利用TCC进行运营的应用网站包括了大众点评网,孤独星球。这些网站依靠用户生成内容,创造了极大的旅游信息源和利润。UGC所具有的去中心化,动态等特点是原本Web1.0时代下所不具有的,Web2.0上的去中心化的内容让每一个用户都可能成为信息平台的主角,使得用户之间的互动增加。这些特点正是UGC所带来的改变,也推进互联网发展到新的发展阶段。
新浪微博是一个由新浪网推出,由用户通过电脑、移动终端、IM等多种途径随时随地的发布文字信息(不超过140个字)、图片和视频信息的一种网络模式。您的粉丝可以第一时间看到你发表的信息和内容。您还可以关注您的粉丝,可以即时看到他们所发布的信息。据调查统计,新浪微博的用户现在已经超过1亿,其影响力大大增加,而在用户生成内容中,其中的40%都是和旅游相关的信息,其信息的特性值得进行研究。
二、研究方法
(一)样本数据来源
所有用于分析的样本都从新浪微博上获得,为了获得一个完全随机的微博样本,笔者通过RSS源来抓取关于旅游的微博信息。因为微博上有广大的信息源,只有很小一部分真正受到用户的关注,为了使数据更有说服力,选取了其中具有热门标签的500条微博进行分析,每个旅游微博包括了发送者名称、发送时间、类别、评论和转载数等结构要素。
(二)数据处理和研究方法
由于原始的数据较为杂乱和不规则,除了按照上面要求进行整理外,还对部分进行筛选,利用统计学中的基本方法对数据的特征进行归类分析,对未来的可能进行推断和预测。利用文本分析法,对旅游信息文本中的时间,空间以及多媒体进行分析。在数据分析和处理的过程中运用EXCEL工具辅助处理。
三、结果与讨论
(一)信息来源
根据发送者的身份,本文把微博上旅游信息发送者分为普通用户、旅游企业、管理机构三类。普通用户在微博平台上主要是创造原创内容,浏览旅游信息,旅游咨询和旅游信息搜索。微博上的旅游信息对游客产生了越来越大的影响。旅游企业,主要是对旅游产品进行营销,旅游攻略和解答用户的疑问等,一条关注度较高的微博在互联网及与之关联的手机WAP平台上发出后短时间内互动性转发就可以抵达微博世界的每一个角落,达到短时间内最多的目击人数。旅游部门主要是对地方性旅游进行宣传与通告等。旅游部门与民众直接联系和交流,民众能充分了解旅游部门工作运转,通过微博这样一个迥异于官方文件的形式,沟通和交流更加变捷。
结果显示普通用户的比例54%。旅游企业的比例32%.旅游部门14%.普通用户占了一半以上,说明了普通用户产生的信息内容起到了决定性的作用。是因为微博上的用户绝大部分是关于旅游的记录,是个性化的信息。普通的用户对分享旅游信息具有巨大的热情,而旅游企业和旅游机构对微博营销和宣传刚刚开始,造成了比起普通用户信息较少,且普通用户的人群基数也比企业和机构大的多。除了分析样本的来源外,还对样本的主题领域进行了类别的区别,主要是分为了目的地信息,交通信息,住宿信息,餐饮信息,行程安排,旅游安全信息五类,并对他们进行分析,各类旅游信息中,发现了普通用户发送的各类旅游微博都占了50%以上,因此说明,微博给了普通用户真正的话语权,在上面发送的信息大部分都是普通用户发送的,给了每个游客创造了发送和分享旅游信息的平台。从以上几个方面可以看出,新浪微博实现了他的口号,“随时随地分享新鲜事”,使得用户在产生旅游信息的同时,构建了自己的个性化平台。从视频类别比例图中可以看出目的地信息,住宿信息,餐饮信息占了样本数的80%,交通信息等占了20%左右。由此可以看出,用户偏重于对目的地的信息分享。但对交通等信息产生过少,这就需要合理引导游客产生的内容,全面为游客服务。
(二)评论数和转载数的分析
在微博用户创造信息内容的同时,评论数和转载数是社会网络中一个非常重要的指标。用户对一条微博的评论和转载反映了对该微博的关注程度。表3中显示了抓取到的最受欢迎的300条三种不同创作类型的视频评论数和转载数的最大值、最小值、评论数和转载数之和大于100,从统计中发现普通用户发送的评论很少,最多的只有1180条,且都是用户之间好友的评论。而旅游企业的评论数最多的为11118,可能原因是旅游企业发送的微博应用较为广泛。所包含的信息内容和质量较高。符合了用户对信息产生兴趣的习惯。在旅游企业的微博中,大于500条微博数占了80%,远远大于普通的用户的5.8%,旅游企业虽然创造的内容比较少,但其关注程度远远大于普通用户,这也说明了旅游企业创造的内容质量相对较高,受欢迎程度较大。普通用户创造内容的特点很大一部分是家庭成员与朋友间的分享,因此他的评论数可能会受到一定的限制。由于微博的内容数量非常庞大,更新速度太过频繁,因此相关的搜索过程也较为困难,对普通用户容易产生认知偏差或者认知负荷等问题。其实一些受冷落的信息内容也很高的质量。这些微博内容不能产生影响的话,会造成资源上巨大的损失。
(三)时间特征
通过对微博内容的分析统计,旅游微博上通常时间表示的词汇为:历史、今天、现在、梦想、将来、记得、如今、打算等词汇。在500条微博中,带有时间的意思表示将近430条,表明人们在微博平台上旅游信息有较强的时间特征。对含有时间表示的词汇进行统计,表示对现在旅游情况表示的词汇如今天,现在,正在等一共是325条微博信息,说明微博上的旅游信息是游客对于旅游的实时分享。对这些信息进行分时间段的统计,发现9:00-11:00,14:00-16:00之间所发送的旅游景区的信息比较多,多是一些感叹词加上少量图片旅游信息。11:00-14:00之间发送的美食旅游信息占了大部分。18:00-22:00之间住宿,酒店,饮食的信息较多,在一定程度上说明微博发表的信息是用户对现在旅游状况的表示。整体来说,通过对时间特征的微博内容分析表明,实时是旅游微博的重要信息特征。总结其原因是手机微博的“轻灵快”的特点造成的。
(四)空间特征
微博上的空间信息是我们利用微博的重要特征,是进行旅游微博信息归类的基础影响因素。通过对微博内容的空间特征进行分析,我们得出了以下的空间特点。在统计的500条微博上,有空间表示的占了428条,表明用户在微博内容上也具有较强的空间地理观念,微博上的空间表示主要分为国内和国外微博信息:微博上对国外旅游描述通常是整体的介绍,微博上的旅游信息的空间地点介绍通常是国外旅游的热点如:西班牙,英国,日本,美国等,对国外历史和现在的评价较多,通常表现为风土人情的介绍和国外风情。这些信息通常是旅游营销和旅游宣传发送的旅游信息,转载和评论相对较多,用户通常是表示对国外旅游的向往如我想去,计划去等,说明国外旅游对用户有较大的吸引力。微博上信息对国内则是某个景点或者景区局部的介绍,对国内微博的旅游信息多表现为景区的服务评价和自然风光。国内的热点通常是海南,北京,上海等著名的景区,用户对国内景点的评价较少,表现为旅游向往的较少,且通常评价的是只是好友之间的互动。整体来说,微博旅游信息有空间表述的较多,且涉及的空间地理信息较多,通过科学的归类,这些信息可以被我们所用。这些空间地理特征,表明了用户的实施实时的旅游位置,统计信息抓取的地理位置,有利于我们进行统计分析。并且表明了旅游者消费的地域,便于进行网络营销。
(五)多媒体信息特征
多媒体信息是我们对微博内容考查的重要一环。多媒体信息对用户的影响较大,这里影响较大时是指转载和评价的概率相对纯文字信息来说。多媒体发布时,使得用户得到的信息信息更多,通常发布多媒体信息的评论和转发的就较多。对500条微博信息的多媒体信息进行统计,有多媒体信息的微博占了将近五层,发送的多媒体信息多为漂亮的自然风光和景色,用户发表图片时通常发布和自己相关的多媒体信息,把自己或者朋友放在多媒体中,一定程度表明了对微博的信任及其准确性。发的多媒体信息多为发送微博的多媒体信息终端通常是电脑,占了有多媒体特征的70%左右,表明手机3G网络还在发展之中,需要手机3G网络的进一步发展和普及。
四、结束语
本文得出以下结论:
第一,在微博的旅游信息中,发送的量最大的为普通用户,是主要的信息来源。旅游企业和旅游部门发送的信息呈现上升趋势。这些用户都乐于分享自己所了解的信息。发送目的地、住宿、餐饮信息等相关信息最多。这些特征表现为用户对这些信息的了解相对较多。而这些信息又是旅游信息内容的关键信息,需要制度来对信息内容进行合理的引导。
第二,由于受浏览对象的限制和发送信息的规范性等因素的影响,旅游企业和旅游部门发送的微博转载率和评论率较多,其影响力较大。
第三,微博旅游信息具有实时性,是对现在旅游情况的描述。
第四,包含的空间地理位置很多,但是分类却非常散乱。包含多媒体信息的微博影响更大,因为其形式更显活泼和真实性,另外3G网络更待需要发展,为实时分享奠定基础。除了信息的质量问题外,旅游服务实时信息是来源多样、高度异质化,碎片化的信息。由各种人员(包括专业人员和非专业人员)通过手机收集和创建的,这样就造成了信息提取难度较大。需要对TCC内容进行合理的分类以及建立相应的制度设计,为信息的提取做好准备。
参考文献:
1、Puri,A.The web of insights:The art and practice of webnography[J].International Journal of Market Research, 2007(3).
2、汪婷,陆林.基于博客的旅游研究信息的提取与分析[J].旅游论坛,2010(8).
3、陈欣,朱庆华,赵宇翔.基于YouTube的视频网站用户生成内容的特性分析[J].图书馆杂志,2009(9).
4、Beaumont,C.Tweet,Tweet,Here Comes Twitter[J].The Telegraph,2008(4).
5、Gretzel,Yoo,K.Use and impact of online travel reviews[D].In P.O’Connor,2008.
(作者单位:重庆理工大学工商管理学院)