论文部分内容阅读
在信息过载时代,人们很难通过传统方式在海量数据中检索到想要的信息,因此基于协同过滤推荐算法成为现代商业模式个性化推荐的主流方法,在各大主流网站取得了较好的商业效果。但由于推荐效果与商业利益直接相关,一些商家为了获取商业利益,通过雇佣网络水军,通过骚扰用户获得好评反馈数据造假等手段为自己的商品获得高的评价。在这种环境下,一些用户习惯于高分或为避免外界干扰而给出高评分,而真实的想法写在文本评论中;还有一些用户没有给出评分而只是文本评论了自己的感受。这些反馈往往不能反映商品的真实评价。调查发现,用户的评论信息还是较为准确的反馈用户的真实评价,因此,本文研究融入评论的情感评价进行评分数据的修正,进而进行个性化的推荐。
为了对上述行为进行研究,本文选择使用爬取来自豆瓣电影评论评分信息的数据进行研究。在使用豆瓣自身个性化电影推荐服务时发现,它的推荐效果偏向于电影整体得分和用户观看类型,电影评论信息并没有起到明显作用。爬取到这些信息之后发现有了两个问题,1.存在评分为0(即用户没有评分)的数据,2.还有很多评价和评分不同倾向的数据。由于豆瓣的推荐系统依赖评分的表现明显,经常会出现推荐的电影评分较高,也大多属于用户喜欢的类型,但并不能满足我们的是实际需求,我们往往还需要自己搜索相关标签去发现我们喜欢的电影。基于此,本文希望对评论和评分不相符的数据进行评分纠正,然后对没有评分的数据进行评分的填充。所以这里提出使用情感分析模型辅助协同过滤计算的算法,对数据进行优化进而优化推荐效果。
这里设计的模型思路如下:1.对数据据进行整理划分后,先使用正确评论数据进行多元情感分析计算,得到模型(BiLSTM+Attention)。2.然后将待纠正和待填充数据放入情感分析模型计算得出新的标签数据。3.最后将经情感分析处理后的数据放入协同过滤算法中进行计算,并获得推荐模型。在获得推荐模型以后,将这个模型应用到设计的网站中,进行推荐工作。在模型设计过程中对比了原始数据上协同过滤算法的推荐效果和经情感分析辅助修正的协同过滤推荐效果,最后结果表明在稀疏度上后者要小于前者,证明有更多的数据参与计算,在MAE和RMSE这两个评价标准上本文设计的模型推荐效果明显的由于原始的协同过滤算法。结果证明,在纠正错误评分数据并填充未评分数据之后,协同过滤的推荐效果更佳,因此融合情感分析的协同过滤推荐算法是更优秀的推荐模型。
本文所设计的iMovie系统主要划分为以下模块,用户登录模块、电影信息发布管理,用户管理,影片信息智能推荐。本文详细给出了系统的需求分析、功能设计、数据库设计和系统实现的方案,并引入了基本的推荐方法实现了相关信息的推荐功能,对系统进行数据测试并运行后,完成之前设计的想法和设计的目标。
为了对上述行为进行研究,本文选择使用爬取来自豆瓣电影评论评分信息的数据进行研究。在使用豆瓣自身个性化电影推荐服务时发现,它的推荐效果偏向于电影整体得分和用户观看类型,电影评论信息并没有起到明显作用。爬取到这些信息之后发现有了两个问题,1.存在评分为0(即用户没有评分)的数据,2.还有很多评价和评分不同倾向的数据。由于豆瓣的推荐系统依赖评分的表现明显,经常会出现推荐的电影评分较高,也大多属于用户喜欢的类型,但并不能满足我们的是实际需求,我们往往还需要自己搜索相关标签去发现我们喜欢的电影。基于此,本文希望对评论和评分不相符的数据进行评分纠正,然后对没有评分的数据进行评分的填充。所以这里提出使用情感分析模型辅助协同过滤计算的算法,对数据进行优化进而优化推荐效果。
这里设计的模型思路如下:1.对数据据进行整理划分后,先使用正确评论数据进行多元情感分析计算,得到模型(BiLSTM+Attention)。2.然后将待纠正和待填充数据放入情感分析模型计算得出新的标签数据。3.最后将经情感分析处理后的数据放入协同过滤算法中进行计算,并获得推荐模型。在获得推荐模型以后,将这个模型应用到设计的网站中,进行推荐工作。在模型设计过程中对比了原始数据上协同过滤算法的推荐效果和经情感分析辅助修正的协同过滤推荐效果,最后结果表明在稀疏度上后者要小于前者,证明有更多的数据参与计算,在MAE和RMSE这两个评价标准上本文设计的模型推荐效果明显的由于原始的协同过滤算法。结果证明,在纠正错误评分数据并填充未评分数据之后,协同过滤的推荐效果更佳,因此融合情感分析的协同过滤推荐算法是更优秀的推荐模型。
本文所设计的iMovie系统主要划分为以下模块,用户登录模块、电影信息发布管理,用户管理,影片信息智能推荐。本文详细给出了系统的需求分析、功能设计、数据库设计和系统实现的方案,并引入了基本的推荐方法实现了相关信息的推荐功能,对系统进行数据测试并运行后,完成之前设计的想法和设计的目标。