论文部分内容阅读
旅游业是我国重点发展的战略产业,大型展会是旅游市场的重要组成部分,由于大型展会存在客流量悖论,故而大型展会的客流量预测成为一个重要问题。客流量必须通过游客的消费行为决策才能体现。本质上看,客流量的变化是游客作为消费者进行消费需要确认、旅游信息搜寻、旅游方案评估、旅游购买决策、游览评价等一系列过程的反映。其中,信息的影响都是通过游客来体现的。关于如何度量游客的消费行为决策过程,传统研究仅能采取调查问卷或代理变量的方法,调查问卷存在一定的统计延迟,代理变量的间接性又难免产生一定偏差,因此,在传统研究条件下,难以对游客的行为决策进行及时、直接的定量研究。互联网时代的到来,信息技术、网络技术与搜索引擎的发展为消费行为乃至社会行为研究开辟了新的领域。网络已成为公众信息搜索的重要渠道,是连接信息、需求、行为的纽带。同时,用户的网络行为以种种的形式被搜索引擎、网络日志、博客、微博等记录。本文将研究集中在网络浏览数据、网络搜索数据和微博互动数据上,统称为网络多源数据。这些数据中蕴含着数以亿计用户需求、关注与反馈信息,能够映射用户在现实生活中的行为趋势和规律。因此,网络多源数据资源可以用来作为行为决策的及时而直接的测度指标。近年来,网络数据与社会经济行为相关性研究已经成为国外的一个研究热点,但是研究结果也较为有限,特别是关于中文网络数据与社会经济行为的相关研究还十分不足,现有研究存在未形成标准的数据处理方法、未对内在机理深入挖掘等问题。 本文以中文网络多源数据为基础,选择中国旅游市场为研究对象,以北京园博会为实例,探讨网络多源数据反映的游客网络行为与游客消费行为决策之间的关系及表现特征。主要研究内容包括:第一,网络行为与展会游览行为的关联机制分析。从消费购买决策理论、信息行为理论等出发,构建了旅游市场中网络行为与展会游览行为的关联机制概念模型,分析了二者之间的逻辑关系与关联机理。第二,网络多源数据的特征及关系分析。首先,分析了网络浏览数据、网络搜索数据、微博数据、客流量数据等多源数据的来源、获取和特点。具体给出了搜索词库、微博文本库和官网访问流量库的建立方法。其次,介绍了网络搜索数据和微博数据的预处理方法。最后,以园博会为例深入分析了网络点击流数据、网络搜索数据、微博数据、客流量数据等网络多源数据之间的关系。第三,基于搜索关注度指数的客流量预测的实证研究。首先,介绍了搜索关注度指数的合成方法。其次,在合成搜索关注度指数的基础上,以北京园博会为例进行实证研究,通过协整分析与Granger因果关系检验考察园博会搜索关注度指数与北京园博会日客流量指标之间的关系。研究结果表明网络搜索关注度指数能反应园博会游客的行为及预期,是园博会日客流量的合理度量指标。第四,基于微博情绪倾向性的客流量预测的实证研究。微博数据中蕴含了大量的游客感受和情绪信息,本章从此角度出发,探索了微博信息对于园博会客流量的预测能力。首先,介绍了微博互动情绪与旅游决策的关系,紧接着自定义了旅游领域的情感词典,通过ROSTEA软件实现了微博文本倾向性的判断和编码,然后应用时差相关分析和格兰杰因果检验找出具有预测能力的微博信息,并在此基础上建立模型证实了微博信息不同于搜索数据的预测能力,并得出相关有效结论。第五,基于微博情绪指数的园博会运营管理决策研究。在微博情绪倾向性分析的基础上,本文进一步深入到微博文本所反映的话题主题中,分析了游客的满意度,研究选取“不满意度”作为测度指标,并通过内容分析法发掘游客不满意的原因和对象。最后,基于微博情绪的实证研究给园博会的管理运营提出了若干建议。