论文部分内容阅读
大数据信息时代的背景下,互联网的发展日益迅猛,各大电子商务平台每天产生的信息量呈现出指数级“爆炸式”增长的趋势,这些信息的背后蕴藏着巨大的不可估量的价值,而这些信息必须经过一系列的转化才能真正被商家和用户所用,从而使其真正的价值得以实现。面对庞大而繁杂的信息,如何帮助用户便捷、高效的获取需要的信息以及如何精准判断所筛选信息是否真正为用户所需,成为了一项具有挑战性的工作。作为人工智能应用领域之一的推荐系统的出现,在很大程度上解决了上述问题。其中,协同过滤推荐算法是应用最为广泛的推荐算法,主要利用用户对项目的评分矩阵预测目标用户对其他未知项目的评分。但是在数据量“爆炸式”增长的大数据时代,各大电子商务平台的用户数量和项目资源数量只增不减。面对庞大的项目资源,每位用户只对其中很小一部分有评分信息,并且不同用户评价过的项目也大不相同,这就使得数据稀疏性问题日益显著。与此同时,单一的用户评分数据已不能完全描绘出用户真正的兴趣偏好,用户数据信息的割裂性问题显著。面对上述情况,用户越来越难以挑选出真正感兴趣的项目,基于传统的协同过滤的推荐系统的推荐质量明显下降,因此需要新的改进型方法来解决推荐问题。K-means聚类算法是一种常见的聚类算法,可以对数据进行前期或中期的处理,把全体数据依据一定的规则划分成不同的类,使得划分好的各类数据做到“类内相似,类间相异”。本文将K-means聚类算法与协同过滤融合,提出了一种基于K-means聚类的改进型协同过滤推荐模型,二者的融合通过缩小目标用户的近邻用户的查找范围缩减了计算相似度的时间,提高了推荐的效率。同时,考虑到独立、单一的用户-评分数据不足以精准描述用户的兴趣偏好的问题,本文结合项目的属性特征数据,构建用户-项目特征相对评分矩阵,对如何进一步构建用户兴趣偏好模型进行了研究,提出了一种基于数据融合的用户行为动态推荐模型。模型建立完成之后,本文依次设计实验观察不同聚类个数、不同相似度度量方法以及不同邻居个数对模型的影响,通过对实验结果的对比分析,得到使本文算法表现最优的参数值,进而得到本文最终的算法New-HBCF。最后,本文选取了MAE、Recision、Recall、F1值四种评价指标对所提出的New-HBCF算法进行评估。实验结果表明,在这四种评价指标的验证下,本文所提出的基于数据融合的用户行为动态推荐方法确实优于传统的协同过滤推荐UBCF以及已有的两种改进型算法,证明了本文所提New-HBCF算法的有效性。在最后的章节里,本文对所研究的内容进行了总结,并对基于数据融合的用户行为动态推荐方法的未来研究提出了几点设想,并期望本文已有的研究能为推荐算法领域的未来研究提供一定的参考和帮助。