论文部分内容阅读
近年来,互联网正在以肉眼可见的速度潜入用户生活的每一个角落,信息随着互联网的发展而呈现出几何式的增长。井喷式的信息是一把双刃剑——信息不再匮乏,但是用户也逐渐淹没在大量无用的信息之中。有效获取并展现信息成为当下研究热点,而个性化推荐则是其中一个领域,通过充分利用用户行为进行分析,并主动向用户提供用户可能感兴趣的内容。由于个性化推荐的优越性,已经在电子商务、社交网站、新闻网站等诸多领域得到广泛应用。推荐系统中应用最为广泛的是协同过滤推荐算法。针对协同过滤算法中的矩阵稀疏性问题,矩阵分解技术成为了许多研究者的一种新选择。本文主要做了如下研究:第一,基于矩阵分解的协同过滤推荐算法的实现原理。第二,改进Yehuda Koren提出的timeSVD++模型,并称之为timeSVDi++模型,一方面该模型融合了相关隐式反馈因子,另一方面则是考虑了数据集的时间效应,该时间效应从三个方面入手,分别为用户偏置、物品偏置以及用户特性偏置。在数据集的时间效应上不仅考虑了其固有周期性,还考虑了用户的情绪瞬态变化,并将其分为无规律部分和有规律部分,其有规律部分通过周期性社会化的情绪来拟合。第三,论述了用单线程实现矩阵分解算法的原理,以及从实际应用出发,随着数据量的增长,讨论了用分布式框架实现矩阵分解推荐算法的步骤;第四,以常用的电影推荐为实验对象,使用矩阵分解协同过滤的方法,实现算法,完成推荐,并在NetFlix数据集上进行实验。本文在矩阵分解的基础上,在模型上融合了相关隐式反馈因子以及在数据时间效应上进行完善,在实现算法上分别使用了单线程实现以及分布式实现,因此本文具有理论和应用的双重价值。