基于用户的协同过滤推荐算法中若干关键技术研究

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:CIA007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网及电子商务的迅速发展,在丰富了人们生活的同时,也带来了信息过载的问题。推荐系统是解决该问题的一种技术,它能为用户提供准确的、智能化、个性化的推荐服务。推荐技术关键的两步分别是为用户确定K近邻的个数和预测用户对项目的评分。首先,对于K近邻,即相似用户的个数,一般是根据经验或者多次实验来确定。因此,现有方法存在主观性较强和过程比较繁琐等问题,影响推荐算法的准确度。其次,对于评分的预测:存在多个近邻时,若采用余弦、皮尔逊等经典相似度计算,用户间的相似度值将大多为1,此时再利用传统的预测方法计算,其结果大都是近似于用户的均值;当只有一个近邻对目标项目打过分时,用户间的相似度对最终评分预测值的贡献度为零,预测结果都是目标用户的打分均值,对用户的偏好区分度不高。针对以上问题,本文在基于用户协同过滤算法的基础上对最近邻的选择和评分值预测方法进行深入的分析和研究,并分别建立了K近邻优化模型和提出了改进的评分值预测方法,主要内容可归纳如下:(1)基于差分进化算法的最近邻优化方法该方法首先结合用户实际打分和预测分值,以最小化平均绝对误差作为目标函数建立优化模型,然后通过差分优化算法计算出最优结果。最后利用平均绝对误差、准确度和召回率三个指标验证了新方法的优越性。新方法打破了传统最近邻通过人为设定相似度阈值的局限,可通过差分优化算法快速找到最优的K值。(2)基于SlopeOne算法的改进预测方法该方法在传统评分预测方法的基础上借鉴SlopeOne算法的思想,充分考虑当前用户和最近邻用户共同打分情况的同时,并融合相似度来体现不同近邻用户对预测当前用户评分行为的贡献度,设计了一种改进的评分值预测算法。新的方法有效解决了传统评分预测方法对用户的偏好区分度不高、没有充分利用用户评分信息、将最近邻用户相同对待等问题。本文区分冷启动和非冷启动两种情况,在MovieLens、Epinions、Netflix三个经典数据集上验证了所提出的两个新方法的性能。新方法在MAE、准确度和召回率上比传统的预测方法具有明显的优势,显著提高了基于用户的协同过滤推荐算法的准确度和推荐质量。本文提出的两种方法适用于冷启动和非冷启动两种环境,与现有推荐系统集成度高,应用推广价值较高。
其他文献
联合战术信息分布系统是旨为各种不同用户提供一种先进的通信、导航、识别(CNI)多功能综合系统。它采用低占空系数,扩展频谱和先进的编码技术,使之具有保密、抗干扰和低截获
垃圾填埋场作为第三大人为甲烷排放源,其甲烷减排已成为垃圾填埋技术研究领域的重点。准好氧填埋由于氧气的引入而可以减少甲烷的产生避免。本文针对准好氧填埋氧气扩散效果不
管理无处不在,管理无处不有。航天企业实行激励机制的主要目的就是为了能够正确诱导员工的工作动机,从而科学合理的实现企业的可持续发展,增加员工自身的满意度,增加工作积极
散文自由灵活,记叙、写景、抒怀、析理皆宜,是历久而弥新的文学体裁。现当代散文流派众多,风格多样,具有很高的审美价值,是高中语文教学不可或缺的内容,在阅读教学中占有重要
随着18世纪晚期以来欧洲的兴起,资本主义的扩张逐渐将全球联系为一个整体,一种现代的“世界体系”开始浮现,在此种世界史叙事背后隐含着西方中心的假设,非西方世界的现代化进
在当今网盘纷纷倒闭的情况下,如果不在公告之日内备份下载,用户的数据就会面临全部消失的危险。另外,在运行网盘上存储数据一样也面临各种风险。本论文讨论在大数据云计算环
数字存储示波器广泛应用于对电子信号的观测与分析中,是一种重要的测试仪器。随着模数转换技术日渐成熟,数字存储示波器的通道带宽和采样率不断提高。随着自动测试接口技术的