论文部分内容阅读
随着互联网的迅猛发展,网络数据呈现爆炸式的增长,其结构也变得越加复杂,越来越多的信息充斥着网络,人们面临着“信息过载”。以个性化推荐技术为代表的推荐系统能够提供一种有效的机制,使用户可以高效获取需要的信息。协同过滤推荐算法是目前应用最成功的个性化推荐技术,其利用目标用户的相似用户对某一物品的评价,形成该目标用户对此物品的评价预测。然而,随着信息的不断膨胀,协同过滤推荐技术面临着越来越大的挑战。其中,数据稀疏、可扩展、冷启动等是协同过滤面临的主要问题。本文针对协同过滤推荐技术中的数据稀疏性和可扩展性问题,对SVD算法、SVD算法衍生的隐语义模型和传统的协同过滤推荐算法进行了深入的研究。首先,本文对个性化推荐技术的发展背景、体系结构进行了深入研究,其中对相似度度量方法和推荐性能度量标准作详细介绍。深入研究了传统协同过滤推荐算法:基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。对这两种推荐算法的实现原理进行了详细的说明,同时也分析了它们的缺陷。其次,深入研究了基于矩阵分解的SVD推荐算法,着重介绍了算法的实现步骤,并分析了其存在的不足。隐语义模型利用梯度下降法改进了SVD算法,解决了其面临的问题。同时,文章还介绍了其他一些基于SVD改进的算法。最后,由于隐语义模型在迭代学习的过程中丢失部分特征数据,本文利用KNN算法来修正遗失的信息,进而提出了两种基于KNN与隐语义模型的融合推荐算法。将改进的融合推荐算法、隐语义模型和传统的协同过滤推荐算法在数据集上进行试验,并对试验结果进行对比分析,从而验证提出的融合算法的有效性。