论文部分内容阅读
随着互联网及电子商务的迅速发展,在丰富了人们生活的同时,也带来了信息过载的问题。推荐系统是解决该问题的一种技术,它能为用户提供准确的、智能化、个性化的推荐服务。推荐技术关键的两步分别是为用户确定K近邻的个数和预测用户对项目的评分。首先,对于K近邻,即相似用户的个数,一般是根据经验或者多次实验来确定。因此,现有方法存在主观性较强和过程比较繁琐等问题,影响推荐算法的准确度。其次,对于评分的预测:存在多个近邻时,若采用余弦、皮尔逊等经典相似度计算,用户间的相似度值将大多为1,此时再利用传统的预测方法计算,其结果大都是近似于用户的均值;当只有一个近邻对目标项目打过分时,用户间的相似度对最终评分预测值的贡献度为零,预测结果都是目标用户的打分均值,对用户的偏好区分度不高。针对以上问题,本文在基于用户协同过滤算法的基础上对最近邻的选择和评分值预测方法进行深入的分析和研究,并分别建立了K近邻优化模型和提出了改进的评分值预测方法,主要内容可归纳如下:(1)基于差分进化算法的最近邻优化方法该方法首先结合用户实际打分和预测分值,以最小化平均绝对误差作为目标函数建立优化模型,然后通过差分优化算法计算出最优结果。最后利用平均绝对误差、准确度和召回率三个指标验证了新方法的优越性。新方法打破了传统最近邻通过人为设定相似度阈值的局限,可通过差分优化算法快速找到最优的K值。(2)基于SlopeOne算法的改进预测方法该方法在传统评分预测方法的基础上借鉴SlopeOne算法的思想,充分考虑当前用户和最近邻用户共同打分情况的同时,并融合相似度来体现不同近邻用户对预测当前用户评分行为的贡献度,设计了一种改进的评分值预测算法。新的方法有效解决了传统评分预测方法对用户的偏好区分度不高、没有充分利用用户评分信息、将最近邻用户相同对待等问题。本文区分冷启动和非冷启动两种情况,在MovieLens、Epinions、Netflix三个经典数据集上验证了所提出的两个新方法的性能。新方法在MAE、准确度和召回率上比传统的预测方法具有明显的优势,显著提高了基于用户的协同过滤推荐算法的准确度和推荐质量。本文提出的两种方法适用于冷启动和非冷启动两种环境,与现有推荐系统集成度高,应用推广价值较高。