论文部分内容阅读
旅游是新时代人民美好生活和精神文化需求的重要内容,是提升人民群众获得感和幸福感的重要载体。旅游产业已经成为国民经济的重要组成部分,是推动高质量发展的重要支柱产业。发展旅游产业是实现经济转型升级和改善环境的重要着力点,是打赢精准脱贫、污染防治等三大攻坚战的重要抓手之一。旅游产业的良性发展离不开公共基础设施的建设投入和政府主管部门的监管和引导。但是当前的旅游管理实践中,受制于有限的公众旅游体验反馈渠道,还不能构建起政府公共服务同公众之间高效、精准的反馈机制,带来了旅游产业投入产出效率低、监管滞后等一系列问题。
大数据技术的发展为解决这一问题带来了新的契机。通过大数据技术可以快捷、实时、精准的获取公众的旅游体验数据,有针对性的对旅游产业进行投入和服务改进,从而实现旅游公共资源的高效配给。近年来,在全国大力实施“互联网+”、大数据战略的趋势下,国家陆续出台了《国务院办公厅关于进一步促进旅游投资和消费的若干意见》,《国家旅游局关于实施“旅游+互联网”行动计划的通知》,《关于促进智慧旅游发展的指导意见》等多部政策文件,强调要贯彻国家大数据战略,创新利用大数据技术推动旅游业产品业态创新、发展模式变革、服务效能提高,促进旅游业转型升级。然而,在当前旅游公共管理实践中对于大数据还仅仅停留在数据收集和简单的分析应用层面,未能对这些数据进行深度的挖掘和利用,使得政府服务和旅客满意度之间没有构建起有效的信息反馈机制,也无法为提升公共服务质量提供保障。
在此背景下,本论文以旅游互联网评论大数据为研究对象,采用符合其数据特点的获取、分析和处理手段,并结合公共管理的实际需求构建相应的理论模型。本论文主要从三个方面开展:一是旅游评论大数据的情感分类研究;二是基于情感分析的游客满意度研究;三是基于旅游评论大数据的舆情研究。本文利用机器学习、情感分析、语义分析等方法挖掘旅游互联网评论海量数据的价值,积极运用大数据优化旅游公共服务质量、提高旅游满意度、完善旅游舆情监管及应对,提升旅游业发展的质量和水平。理论层面,本文的研究弥补了旅游大数据挖掘与分析相关研究的不足,丰富和拓展大数据创新领域;方法层面,基于机器学习的文本挖掘方法实现对海量互联网旅游评论大数据的智能分析,基于情感分析的满意度研究突破传统的满意度调查和统计方法,提出更为科学客观的满意度计算方法,具有重要的方法论意义;实践层面,本论文研究成果有助于旅游企业和管理部门充分挖掘旅游互联网评论海量数据的价值,积极运用互联网和大数据创新旅游产品和服务、促进旅游市场公平竞争、有序发展和旅游业转型升级,进而促进旅游产业以及全域旅游的发展。
在基于旅游评论大数据的情感分类研究中,聚焦于如何通过技术手段有效进行评论数据的识别、分类和分析处理来构建研究模型,本研究采用有监督学习的随机森林模型分类方法。有监督学习的机器算法需要大量的训练集来建立分类器,为保证训练集的标记更加具有参考性与代表性,本研究的情感标注工作由旅游大数据语义分析工作的专家来完成。得到标记的训练集后,又通过一系列数据处理工作,包括主观句的筛选工作、分词工作、特征提取等,最后建立随机森林分类器,并通过测试集来进行测试。通过准确率、召回率以及F值的评估,本文建立的分类器效果比传统的支持向量机模型以及贝叶斯分类器模型都要优越,说明了本文所构建模型的有效性。
关于基于情感分析的游客满意度研究,在旅游评论大数据的情感分类研究基础上,进一步使用统计学、自然语言处理的方法,通过情感分析得到游客的满意度值,构建政府服务与公众满意度的反馈机制,引导政府在旅游公共基础设施投入、服务监管等方面进行改进。该部分的主要工作是建立了研究所需要的正向情感词典与负向情感词典,以及否定词典和情感副词词典,利用R软件进行分词等一系列数据处理工作,并将分词完毕的评论数据与本文建立的情感词典进行匹配加权,最后得到每一个用户的最终满意度值。相对于IPA模型等一些问卷数据方法,通过对OTA平台上的评论数据进行分析得到满意度值,该方法具有更好的客观性和及时性。
在基于旅游评论大数据的舆情研究中,本部分设计了数据抓取与处理策略,借助基础词库、旅游行业专用词库、专用情感词库等,研究旅游舆情,识别发布旅游舆情的媒体、产生旅游舆情的地域,再基于自然语言处理(NLP)、关键词抽取(基于TF-IDF算法)、文本分类聚类和情感分析方法对游客评论的情感及其走势进行了研究。该部分通过对微博、微信、新闻、论坛等媒体上涉及黄鹤楼旅游景区的相关评论数据进行提取,从旅游舆情总体情况介绍、媒体分布、地域分析、关键词云、舆论走势、情绪分析等方面展开,对旅游舆情进行了多维度分析。
本研究以旅游评论大数据为对象,通过大数据技术深度挖掘其内在价值,提出了旅游评论大数据挖掘的情感分析方法,并以此构建游客对景区公共服务满意度的研究模型和旅游舆情的预警预测体系,将其作为公共服务改进和提升公共资源配置效率的逻辑原点,为大数据技术与当代公共管理研究的结合提供了新视野。在研究中使用的机器学习、情感分析、聚类分析等一系列大数据分析技术和方法,将丰富旅游公共管理的研究手段和方法,提升旅游公共管理的研究水平。
大数据技术的发展为解决这一问题带来了新的契机。通过大数据技术可以快捷、实时、精准的获取公众的旅游体验数据,有针对性的对旅游产业进行投入和服务改进,从而实现旅游公共资源的高效配给。近年来,在全国大力实施“互联网+”、大数据战略的趋势下,国家陆续出台了《国务院办公厅关于进一步促进旅游投资和消费的若干意见》,《国家旅游局关于实施“旅游+互联网”行动计划的通知》,《关于促进智慧旅游发展的指导意见》等多部政策文件,强调要贯彻国家大数据战略,创新利用大数据技术推动旅游业产品业态创新、发展模式变革、服务效能提高,促进旅游业转型升级。然而,在当前旅游公共管理实践中对于大数据还仅仅停留在数据收集和简单的分析应用层面,未能对这些数据进行深度的挖掘和利用,使得政府服务和旅客满意度之间没有构建起有效的信息反馈机制,也无法为提升公共服务质量提供保障。
在此背景下,本论文以旅游互联网评论大数据为研究对象,采用符合其数据特点的获取、分析和处理手段,并结合公共管理的实际需求构建相应的理论模型。本论文主要从三个方面开展:一是旅游评论大数据的情感分类研究;二是基于情感分析的游客满意度研究;三是基于旅游评论大数据的舆情研究。本文利用机器学习、情感分析、语义分析等方法挖掘旅游互联网评论海量数据的价值,积极运用大数据优化旅游公共服务质量、提高旅游满意度、完善旅游舆情监管及应对,提升旅游业发展的质量和水平。理论层面,本文的研究弥补了旅游大数据挖掘与分析相关研究的不足,丰富和拓展大数据创新领域;方法层面,基于机器学习的文本挖掘方法实现对海量互联网旅游评论大数据的智能分析,基于情感分析的满意度研究突破传统的满意度调查和统计方法,提出更为科学客观的满意度计算方法,具有重要的方法论意义;实践层面,本论文研究成果有助于旅游企业和管理部门充分挖掘旅游互联网评论海量数据的价值,积极运用互联网和大数据创新旅游产品和服务、促进旅游市场公平竞争、有序发展和旅游业转型升级,进而促进旅游产业以及全域旅游的发展。
在基于旅游评论大数据的情感分类研究中,聚焦于如何通过技术手段有效进行评论数据的识别、分类和分析处理来构建研究模型,本研究采用有监督学习的随机森林模型分类方法。有监督学习的机器算法需要大量的训练集来建立分类器,为保证训练集的标记更加具有参考性与代表性,本研究的情感标注工作由旅游大数据语义分析工作的专家来完成。得到标记的训练集后,又通过一系列数据处理工作,包括主观句的筛选工作、分词工作、特征提取等,最后建立随机森林分类器,并通过测试集来进行测试。通过准确率、召回率以及F值的评估,本文建立的分类器效果比传统的支持向量机模型以及贝叶斯分类器模型都要优越,说明了本文所构建模型的有效性。
关于基于情感分析的游客满意度研究,在旅游评论大数据的情感分类研究基础上,进一步使用统计学、自然语言处理的方法,通过情感分析得到游客的满意度值,构建政府服务与公众满意度的反馈机制,引导政府在旅游公共基础设施投入、服务监管等方面进行改进。该部分的主要工作是建立了研究所需要的正向情感词典与负向情感词典,以及否定词典和情感副词词典,利用R软件进行分词等一系列数据处理工作,并将分词完毕的评论数据与本文建立的情感词典进行匹配加权,最后得到每一个用户的最终满意度值。相对于IPA模型等一些问卷数据方法,通过对OTA平台上的评论数据进行分析得到满意度值,该方法具有更好的客观性和及时性。
在基于旅游评论大数据的舆情研究中,本部分设计了数据抓取与处理策略,借助基础词库、旅游行业专用词库、专用情感词库等,研究旅游舆情,识别发布旅游舆情的媒体、产生旅游舆情的地域,再基于自然语言处理(NLP)、关键词抽取(基于TF-IDF算法)、文本分类聚类和情感分析方法对游客评论的情感及其走势进行了研究。该部分通过对微博、微信、新闻、论坛等媒体上涉及黄鹤楼旅游景区的相关评论数据进行提取,从旅游舆情总体情况介绍、媒体分布、地域分析、关键词云、舆论走势、情绪分析等方面展开,对旅游舆情进行了多维度分析。
本研究以旅游评论大数据为对象,通过大数据技术深度挖掘其内在价值,提出了旅游评论大数据挖掘的情感分析方法,并以此构建游客对景区公共服务满意度的研究模型和旅游舆情的预警预测体系,将其作为公共服务改进和提升公共资源配置效率的逻辑原点,为大数据技术与当代公共管理研究的结合提供了新视野。在研究中使用的机器学习、情感分析、聚类分析等一系列大数据分析技术和方法,将丰富旅游公共管理的研究手段和方法,提升旅游公共管理的研究水平。