论文部分内容阅读
随着互联网的快速发展,各式各样的网站上的评论数据不断积累,而评论情感分析的主要任务正是基于这些大量的评论数据,分析出用户直观的情感表达。近年来,基于文本主题模型的评论情感分析方法得到广泛的关注,但是大部分基于主题模型的方法只考虑了评论的文本信息,而忽略了发表评论的用户和评论针对的物品信息,本文以主题模型为基础,结合用户-物品评分信息和用户相似度信息,完成了评论的情感分析任务。 首先,本文介绍了传统的主题模型算法及其应用,接着基于传统的文本主题模型,本文提出了基于监督主题模型和用户相似度的评论情感分析模型(STUS)。首先采用监督主题模型作为模型的基础,它是对基本的主题模型的扩展,核心思想是在文本主题信息的基础上,加入标签数据,从而提高模型的性能。其次,本文结合概率矩阵分解算法和用户间相似度评估模型,提出了从评论文本、用户-物品评分矩阵和用户相似度到评论情感评分的模型处理框架STUS。最后,基于STUS模型框架,本文阐述了详细的评论文档的生成过程、模型算法和评论情感分析任务的完成,并采用坐标下降的方法递归的优化模型的参数。综上,本文提出的STUS是一个基于监督主题模型,结合多元信息的评论情感分析模型。 本文在Epinions公开数据集上进行对比实验和结果分析。实验结果表明本文提出的模型STUS在准确度、误差等性能方面都优于目前已有的基于主题模型或协同过滤的情感分析模型。