基于监督主题模型和用户相似度的评论情感分析算法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yangyujie309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各式各样的网站上的评论数据不断积累,而评论情感分析的主要任务正是基于这些大量的评论数据,分析出用户直观的情感表达。近年来,基于文本主题模型的评论情感分析方法得到广泛的关注,但是大部分基于主题模型的方法只考虑了评论的文本信息,而忽略了发表评论的用户和评论针对的物品信息,本文以主题模型为基础,结合用户-物品评分信息和用户相似度信息,完成了评论的情感分析任务。  首先,本文介绍了传统的主题模型算法及其应用,接着基于传统的文本主题模型,本文提出了基于监督主题模型和用户相似度的评论情感分析模型(STUS)。首先采用监督主题模型作为模型的基础,它是对基本的主题模型的扩展,核心思想是在文本主题信息的基础上,加入标签数据,从而提高模型的性能。其次,本文结合概率矩阵分解算法和用户间相似度评估模型,提出了从评论文本、用户-物品评分矩阵和用户相似度到评论情感评分的模型处理框架STUS。最后,基于STUS模型框架,本文阐述了详细的评论文档的生成过程、模型算法和评论情感分析任务的完成,并采用坐标下降的方法递归的优化模型的参数。综上,本文提出的STUS是一个基于监督主题模型,结合多元信息的评论情感分析模型。  本文在Epinions公开数据集上进行对比实验和结果分析。实验结果表明本文提出的模型STUS在准确度、误差等性能方面都优于目前已有的基于主题模型或协同过滤的情感分析模型。
其他文献
数据挖掘是人工智能和数据库技术等领域的研究热点,正在现实应用中发挥着强大的作用。关联规则挖掘是数据挖掘中一个最活跃、最重要的研究课题,主要目的是从给定的数据集中发
互联网在线广告行业蓬勃发展,是一个具有数百亿规模的庞大市场。在线广告领域的核心问题之一是广告的点击率预测,准确的点击率预测模型对于提高广告收益具有重要意义。工业界和
当今社会是一个信息化社会,计算机网络的应用已经深入到日常生活的各个领域,人们的生活和工作也更加依赖网络,从而网络技术也就成为一个越来越重要的技术。大量网络应用对服
数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合,是为决策支持系统和联机分析应用提供数据源的结构化数据环境。数据仓库不同于数据库,数
随着生产水平的提高和企业规模的扩大,现代企业迫切需要一个报表平台系统,利用当前Internet的迅速发展,使得分布在不同地方的子公司或单位能够随时提交各种生产经营报表,从而对数
随着网络规模的日益扩展,网络体系结构模型越来越复杂,网络用户及承载业务种类也与日剧增。认知网络为解决当前网络所面临的日益增加的复杂度提供了新的解决途径,尤其是在无
本文以GPS定位技术为基础,综合利用GPRS无线传输技术、GIS地理信息技术,设计并实现了物流行业中对集装箱卡车的实时监控系统。系统以安装在集装箱卡车上的GPS接收机发送的定
真实感绘制中通常需要大量采样才能得到收敛的结果,在采样不充足的情况下,结果中常出现明显噪点,如何减少采样加快收敛是一个很重要的问题。光场具有低秩性和连续性,可以认为
建立数学模型是工程应用和科研中的一个重要环节。在工程技术、经济管理、自然科学和社会科学等领域普遍存在着许多随时间变化的动态系统和非线性现象。遗传算法用于智能建模
随着互联网的迅猛发展,网络中的评论信息越来越多的受到人们的关注,加快了文本褒贬倾向性分析的脚步。本文主要针对中文句子级别的褒贬倾向性分析做了以下工作:   1.建立了绝