融入情感分析的协同过滤算法电影推荐系统设计与实现

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:lizhongfeng3218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息过载时代,人们很难通过传统方式在海量数据中检索到想要的信息,因此基于协同过滤推荐算法成为现代商业模式个性化推荐的主流方法,在各大主流网站取得了较好的商业效果。但由于推荐效果与商业利益直接相关,一些商家为了获取商业利益,通过雇佣网络水军,通过骚扰用户获得好评反馈数据造假等手段为自己的商品获得高的评价。在这种环境下,一些用户习惯于高分或为避免外界干扰而给出高评分,而真实的想法写在文本评论中;还有一些用户没有给出评分而只是文本评论了自己的感受。这些反馈往往不能反映商品的真实评价。调查发现,用户的评论信息还是较为准确的反馈用户的真实评价,因此,本文研究融入评论的情感评价进行评分数据的修正,进而进行个性化的推荐。
  为了对上述行为进行研究,本文选择使用爬取来自豆瓣电影评论评分信息的数据进行研究。在使用豆瓣自身个性化电影推荐服务时发现,它的推荐效果偏向于电影整体得分和用户观看类型,电影评论信息并没有起到明显作用。爬取到这些信息之后发现有了两个问题,1.存在评分为0(即用户没有评分)的数据,2.还有很多评价和评分不同倾向的数据。由于豆瓣的推荐系统依赖评分的表现明显,经常会出现推荐的电影评分较高,也大多属于用户喜欢的类型,但并不能满足我们的是实际需求,我们往往还需要自己搜索相关标签去发现我们喜欢的电影。基于此,本文希望对评论和评分不相符的数据进行评分纠正,然后对没有评分的数据进行评分的填充。所以这里提出使用情感分析模型辅助协同过滤计算的算法,对数据进行优化进而优化推荐效果。
  这里设计的模型思路如下:1.对数据据进行整理划分后,先使用正确评论数据进行多元情感分析计算,得到模型(BiLSTM+Attention)。2.然后将待纠正和待填充数据放入情感分析模型计算得出新的标签数据。3.最后将经情感分析处理后的数据放入协同过滤算法中进行计算,并获得推荐模型。在获得推荐模型以后,将这个模型应用到设计的网站中,进行推荐工作。在模型设计过程中对比了原始数据上协同过滤算法的推荐效果和经情感分析辅助修正的协同过滤推荐效果,最后结果表明在稀疏度上后者要小于前者,证明有更多的数据参与计算,在MAE和RMSE这两个评价标准上本文设计的模型推荐效果明显的由于原始的协同过滤算法。结果证明,在纠正错误评分数据并填充未评分数据之后,协同过滤的推荐效果更佳,因此融合情感分析的协同过滤推荐算法是更优秀的推荐模型。
  本文所设计的iMovie系统主要划分为以下模块,用户登录模块、电影信息发布管理,用户管理,影片信息智能推荐。本文详细给出了系统的需求分析、功能设计、数据库设计和系统实现的方案,并引入了基本的推荐方法实现了相关信息的推荐功能,对系统进行数据测试并运行后,完成之前设计的想法和设计的目标。
其他文献
压缩感知理论利用信号稀疏性直接采样压缩后的信号,具有信号采样速率低、数据存储压力小等优点,在无线传感器网络、生物电信号采集、多输入多输出系统设计以及变换域采样系统设计等领域具有广泛的应用前景。自压缩感知理论问世以来,如何设计更高效、更便于硬件实现的信号编码器以及如何设计复杂度低、重构质量高的重构算法一直是该领域的重点研究方向。  本论文对压缩感知理论中的观测矩阵优化设计、重构算法设计及压缩感知硬件
学位
多旋翼无人机的应用场景在过去几年从军事领域逐渐扩展到民用领域,其被广泛的应用于搜索救援、遥感测量、航空摄影、电力检修和农业灌溉等任务。随着芯片、传感器的小型化,人工智能相关技术的快速发展,再加上为了满足应用场景的多样化、复杂化,多旋翼无人机逐渐向小型化、智能化发展。研究人员开始探索研究非传统的感知、控制方法,以期望无人机能够在复杂、非结构环境下自主的完成感知、决策、规划和控制。  作为一种空中机器
随着信息技术的不断发展,信息交流变得越来越方便,同时安全性也受到越来越多的挑战,相关的安全性技术也越来越受到关注。信息隐藏技术中的隐写术可以将秘密信息隐藏在载体中传递而不引起第三方关注。因此隐写术成为常用的保证信息安全性的技术。本文以图像作为隐写的载体信号,使用深度学习模型进行空域隐写,论文的主要成果包括:  1.提出一种基于特征重建的感知损失的隐写方案。该方案参考迁移学习的相关研究成果,采用常见
学位
电阻抗层析成像(ElectricalImpedanceTomography简称EIT)通过被测场域边界处的电学测量信号,反演场域内的电导率的二维/三维分布情况,具有时间分辨率高、非侵入、无辐射、结构简单等优点,在多相流工业测量和生物医学检测领域具有广阔的应用前景。然而,由于EIT技术固有的“软场”特性,其图像重建问题具有严重的非线性和欠定性,导致其重建的图像分辨率低,限制了该技术的推广和应用。因此
电阻层析成像(Electrical Resistance Tomography,ERT)具有非扰动、无辐射、低成本等优势,在多相流检测、生物医学成像等领域有广泛的应用潜力。图像重建算法作为ERT系统的关键环节,其成像精度和实时性的改善对于监测与控制生产过程、提高生产稳定性和安全性具有重大意义。但由于图像重建过程本身存在的非线性、欠定性和病态性等问题,已有的图像重建算法很难兼顾成像的准确性和实时性,
学位
全方位移动机器人是一种能够实现对平动和转动独立控制的完整约束机器人,其操作性和机动性较强,在复杂和狭窄空间里表现尤为出色。输入状态约束下的全方位移动机器人轨迹追踪控制是目前移动机器人运动控制的研究热点之一。在机器人的实际应用中,系统中存在的外部扰动(如摩擦力)、参数不确定性等因素都会对控制性能产生不利影响。因此,本文对满足输入状态约束的高精度、强鲁棒性全方位移动机器人轨迹追踪控制器展开了研究,主要
四旋翼无人机具有结构简单、机身质量轻、灵活性强而且能够垂直起降和定点悬停等优点,在环境监测、目标搜索、事故救援等领域得到了广泛应用。四旋翼无人机模型具有非线性、强耦合、欠驱动等特点,且在飞行过程中易受外界扰动的影响。为了提升四旋翼无人机控制系统的性能,论文重点对四旋翼无人机姿态控制方法展开研究,主要内容有:  (1)针对不确定干扰上界未知情形下的四旋翼无人机姿态控制问题,提出了基于自适应多变量干扰
气液两相流系统广泛存在于化工、制药、石油、能源等工业生产过程中,由于气液两相流相间存在复杂的相互作用及相对运动,气液两相流流型丰富多样,局部流动结构呈现高度的复杂性、非线性和多尺度特性。特别需要指出的是,在气液两相流段塞流及混状流中存在明显下降液膜,且液膜结构非稳态波动特征明显;当流体具有较大湍动能量时,下降流液膜会发生明显的结构演化,且极易夹带多尺度分散气泡。气液两相流的局部结构特性研究对流型转
石油作为宝贵的矿产资源,其开采的难度正逐渐增加。实时的测井信息获取对油田进行石油高效开采具有重大意义,测井数据传输系统实现了井下测井仪器到地面上位机的电缆通信。随着多相流领域传感技术的不断发展,越来越多类型的传感仪器和传感阵列对数据传输速率提出了更高的要求。此外,测井系统特有的单芯电缆信道以及高温高压的外部环境,使得系统对于频带利用率以及抗干扰性能有着更高的要求。因此,测井数据传输系统的性能制约着
肺癌作为全球性的恶性疾病,一直以来对人类的生命健康造成了严重的威胁。肺部病变初期在影像上表现为肺部内出现结节,肺结节有良恶性之分,恶性肺结节往往会发展成为肺癌,因此肺癌诊断的重要环节就是要在肺部CT图像中及时准确区分出结节和非结节并判断肺结节的良恶性。传统的计算机辅助肺结节分类算法以人工提取特征和机器学习算法为主,肺结节分类过程复杂,分类过程中每个步骤的性能都会对分类结果产生影响,存在分类假阳性率
学位