基于Hadoop的个性化推荐算法的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:yuyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今全球互联网数据正在爆发式地增长,面对海量数据,信息消费者越来越难从中快速准确地找到有意义的、对自己有价值的信息。个性化推荐技术和推荐算法通过挖掘用户历史和偏好,能够帮助其更加方便快捷地从海量数据中发现对自己有用的信息。然而如此大规模的数据量给原有的单处理器和串行计算技术带来了巨大挑战,全球纷纷掀起大数据技术研究的浪潮。近年来开源的Hadoop系统为大数据处理提供了可靠有效的平台,得到广泛普及使用,成为大数据处理的主流和事实标准。本文深入研究了个性化推荐算法的有关理论,针对Slope One协同过滤算法做了深入讨论,现有Slope One算法及其他改进算法只是简单地考虑项目评分的数量,而没有考虑项目之间的关联,从而对精度的提高也是极其有限的。本文创新性地将关联规则中项目之间的关联性融入传统Slope One算法,提出一种改进型算法——Confidence-based Slope One(CSO)算法,通过引入置信度加权以及设定最小支持度阈值删减非频繁项,进一步提高预测结果精度。此外,面对前所未有的海量数据,本文对Hadoop系统及其核心技术进行了深入研究,将CSO推荐算法基于MapReduce计算模型做了并行化的任务分解和实现,最终实现了基于Hadoop的并行化处理的个性化推荐算法。本文搭建了单机、伪分布式Hadoop、完全分布式Hadoop实验平台,从算法性能和算法精度两个方面对提出的CSO推荐算法进行了测试、调优和分析。实验结果表明,相比传统Slope One算法,本文.所提出的基于Hadoop的CSO算法具有更高的运算性能,并且能够实现更精确的推荐。
其他文献
研究了大豆子粒大小、褐斑、紫斑和虫口等外观品质对其化学品质的影响。结果表明,蛋白质含量、脂肪含量和蛋白脂肪总含量均随子粒的增大而增加。各种病虫害使大豆子粒蛋白质含
我国的高校教育是目前国家培养人才的主要途径,也是当代大部分青年通往社会的必经之路,而高校不仅承担着对学生进行专业知识教育的责任,同时对学生进行思想政治教育也非常关
第二次世界大战后 ,随着发展中国家工业化的推进和经济的迅速发展 ,其城市化进程也日益加快。本文通过对发展中国家与发达国家城市化进程的比较 ,分析了发展中国家城市化进程
<正> 祛风活血法,系祛风药和活血药相结合的治法。汉·《金匮要略》中,以红蓝花酒治“妇人六十二种风”病,方中仅红花一味活血药,无风药而治风病,即寓“治风先治血,血行风自
在单轴输入条件下,三环减速器三片内齿圈受力情况相同,通过分析单片内齿圈的受力情况,指出在受力计算时不可忽视惯性力和三片内齿圈受力情况,将有助于三环减速器的设计、使用
通过接种根瘤菌,设置不同氮水平,对大豆盛花期根瘤及大豆产量构成因子的变化进行研究。结果表明:在一定施氮范围内施用根瘤菌,可明显提高大豆根瘤风干重,促进成荚、鼓粒,对增