基于用户属性聚类和奇异值分解算法的推荐技术研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:abcprint
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的日益普及,电子商务已经成为人们生活中不可或缺的组成部分。大量的互联网用户与产品涌入到形形色色的电子商务网站中去,这就使得推荐系统得到了得天独厚的发展空间。随着系统规模的不断扩大,如何快速、有效地对不同的用户给出个性化的建议,已成为每一个推荐系统的首要目标。在电子商务中,协同过滤推荐技术是应用最为广泛的技术之一,然而现有的大多数协同过滤算法都存在着“冷启动”、“数据稀疏性”等问题。与此同时,目前大多数推荐系统往往忽略了用户自身的一些特性,如性别、年龄、职业等,这会严重影响推荐系统的推荐质量。综上,如何在数据稀疏的情况下,通过用户的属性值与改进的奇异值分解算法来提高推荐系统的推荐质量成为本文主要的研究问题。本文主要以推荐系统中的冷启动、数据稀疏问题为主要研究对象。在深入分析各种常见推荐算法的基础上,提出了一种利用用户属性值的聚类方法与图像处理中常见的奇异值分解(SVD)算法相结合的混合推荐算法。该算法在数据稀疏的情况下,可以有效的提高推荐系统的预测准确率。本文的主要研究成果如下:(1)深入分析推荐系统中的关键技术,着重分析协同过滤推荐算法的优缺点,指出了使用混合推荐算法的重要性。(2)介绍了常用的聚类方法,并且分析推荐系统中用户属性特征的重要性。提出一种全新的计算用户特征值的方法,通过该方法计算出每个用户的特征值,然后利用K-means聚类方法将系统中的用户进行聚类。(3)对奇异值分解的有关概念以及应用进行研究,分析了传统奇异值分解算法的不足。并且对原有的奇异值分解算法进行改进,结合用户特征值聚类,对稀疏矩阵进行填充。(4)利用本文提出的算法,实现了一个推荐系统的引擎,并且为指定用户做出推荐,通过该引擎描述本文提出算法的执行过程。利用实现的推荐系统申请了专利《基于奇异值分解算法的聚类协同过滤推荐系统》。(5)利用已有数据集设计多个实验分别验证各个推荐算法的推荐质量,最后比较本文提出的算法与一些传统的推荐算法之间的推荐质量,分析测试结果,证明了本文提出算法可以有效改进推荐质量。
其他文献
市政工程作为当代社会发展和建设中的重要性基础设施,随着科技步伐的加快,如今的市政建设规模正在逐渐扩大,且数量也呈现出日渐递增的趋势.然而,对当前的建筑市场展开调查得
该文研究了在数据融合系统中构建具有推理能力、能够完成目标识别功能的子专家系统的技术.详细讨论了专家系统、黑板模型的概念和构建方法;研究了现代战场环境下辐射源识别、
该文研究ANGEL-Ⅱ的查询处理的实现,查询处理作为该系统的核心模块,其实现包括四个阶段:查询语言的语言处理、查询图处理、查询计划的执行和查询结果的返回.针对ANGEL-Ⅱ数据
该文对基于CORBA的网络管理系统进行了探讨和研究,将系统构造为符合client/server模式的三层体系结构,并实现了系统结构中的几个关键模块.在该原型系统的设计中提出了整个系
随着计算机性能提高,微处理器系统已在穆斯堡尔谱实验数据采集过程中付应用.研 究人员设计实现了基于RT Linux的远程穆斯堡尔谱实时数据采集系统.它可通过互联网在远端利用浏
马克思主义者看问题,不但要看到部分,而且要看到全体。一个蛤蟆坐在井里说:“天有一个井大。”这是不对的,因为天不止一个井大。如果它说:“天的某一部分有一个井大。”这是
随着环保产业和生态文明建设的加速发展,环境咨询服务行业成为环保产业发展转型的重要支柱.发展环境咨询服行业可以实现环境保护的目标,对加快产业结构升级和转变经济发展方
公共建筑节能是社会节能管理的重要组成部分,率先做好公共建筑节能工作可以起到模范带头作用.本文从公共建筑的用能特点出发,在遵循审计规范等相关要求的前提下,研究如何构建
学位
随着经济社会的不断发展,人类对石油化工产品的需求量越来越大,石油化工生产装置的生产规模也越来越大,进一步推动着石油化工产业技术不断向前发展.作为一项重要的安装工程,