基于Hadoop的电影推荐系统研究与实现

被引量 : 12次 | 上传用户:plutoBSD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,人们可以在互联网上购买各种商品,完成各种商务活动,越来越依赖于从网络中获取需要的信息,淘宝网仅在2014年双十一就达到了591亿的销量。但是,互联网的飞速发展也给服务提供商带来了许多问题亟需解决,如让用户从海量数据中实现按需提取,为用户提供个性化的服务,带给用户更好的体验,从而产生更多的收益,应用推荐系统是一种较好解决方案。然而,中小型企业使用的推荐系统基于单机模式的简单关联的算法,效果一般且无法处理海量数据,同时存在缺少精通分布式平台处理海量数据人员的问题,这些都给实现分布式的推荐系统带来了很大的技术挑战。因此,为了扩展推荐系统的应用需求,本文以实际出发,实现了一种适用于中小型企业的快速搭建基于Hadoop的分布式推荐平台的方法,降低了推荐系统的应用平台。本文以实现电影推荐系统为例,首先介绍了Hadoop平台中的两大核心内容HDFS和MapReduce。系统选择HDFS这样一种具有高度容错性的分布式文件系统作为底层文件系统,将其部署到廉价的集群中,同时选择MapReduce作为海量数据处理工具。然后介绍了本课题所用的WEB框架—SpringMVC,它具有灵活易用、逻辑清楚等优点,MVC的三层结构设计也为推荐系统提供了良好的接口。推荐算法能够帮助用户发现可能感兴趣的内容。本文重点研究了基于内容的推荐算法、基于关联规则的推荐算法和协同过滤推荐算法。对比三个算法后,选用协同过滤推荐算法中基于项目的协同过滤算法。由于传统的基于项目的协同过滤算法是基于单机模式的,无法运行于Hadoop,本文将它改进成基于并行化的协同过滤算法,并运用到基于Hadoop的电影推荐系统中。基于Hadoop的电影推荐系统的实现主要围绕系统目标确立、需求分析、系统设计、实现与测试等几个部分展开。完成了Hadoop平台和SpringMVC环境的搭建,并基于推荐模块、用户交互模块和分布式模块的三大模块进行详细设计与实现。通过对系统的测试和实验的分析,表明基于Hadoop的电影推荐系统在功能上和并发性上都有很好的效果,能够满足中小型企业对个性化推荐系统的需求。
其他文献
<正>具备较高的理论水平、精湛的业务本领和艰苦朴素的工作作风是领导干部应具备的基本素养,也是政治信仰是否坚定、素质作风是否过硬的体现。通俗地讲,领导干部要兼备"笔杆
主要介绍通识课"化学与社会"的课程体系建设,其特点在于突出课程的"通识"性。课程通过帮助学生消除对化学的误解和向学生介绍社会中的化学常识,来加强对学生科学思辨能力的培养。
目的观察康妇炎胶囊联合抗生素治疗盆腔炎后慢性盆腔痛患者的临床效果。方法选择在医院治疗的盆腔炎性疾病后慢性盆腔痛患者100例为研究对象,随机分为观察组和对照组,每组50
<正> 目的:探讨腹腔镜手术中脏器与血管损伤并发症的诱因、临床特点与防治措施。方法:1994.12~2003.8我院宫腔镜中心行各类腹腔镜手术1832例,选择术中脏器与血管损伤并发症患
会议
REFe2 Laves相合金做为磁致伸缩材料在室温下具有Joule、Villari、dE、Viedemann、Anti-Viedemann、Jump等效应,在声学、微位移、力学传感、磁学、热学、航空等领域得到了广
渗透系数是级配碎石渗流特性的重要参数,通过颗粒流数值方法建立碎石土渗流计算模型,利用流动方程和水压方程以及碎石之间的应力变形响应进行耦合计算,得到相应级配碎石的渗
<正>西方民主在二战后被很多人奉为圭臬,尤其是"冷战"后更是被尊为"普世价值"。美国日裔政治学家弗朗西斯·福山在1989年出版的《历史的终结》中提出"自由民主可能象征人类社
当前企业之间的竞争十分激烈,尤其是国际间贸易的增多,企业面临更严峻的生存环境。在充满竞争风险的社会环境中,公司法也进行了不断的调整,公司法的功能和体系也在发展和变化
目的评价吲哒帕胺与依那普利治疗老年高血压病的成本-效果。方法将患者36例随机分为A、B两组,分别给予吲哒帕胺与依那普利,运用药物经济学的成本-效果分析法计算并进行分析和
形状记忆合金由于具备特有的形状记忆效应和超弹性,能作为心脏支架和血管膨胀器材料等植入人体。但是它在体内表现为生物惰性,用羟基磷灰石(HA)生物陶瓷涂层可改善其生物相容