基于协同过滤的评分预测推荐算法研究

来源 :北京工业大学 | 被引量 : 10次 | 上传用户:Heavenws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
web2.0带领互联网走进了一个新时代,用户是互联网的核心,生产数据的同时也在消费数据。互联网的普及和互联网用户数量的迅猛增长使得互联网上的信息呈现爆炸式的增长,带来了“信息过载”的问题。目前解决信息过载问题有两种办法:信息检索技术和信息过滤技术。基于信息检索技术的搜索引擎已经获得了很大的成功。但是搜索引擎依赖于用户对信息描述的准确度而导致搜索结果质量不高,且不能主动推送给用户所需的信息。基于信息过滤的推荐系统为这个问题提供了解决方案。推荐系统基于用户的历史行为数据,建立相关模型挖掘用户需求和兴趣,进而筛选出对用户有用的信息。协同过滤是推荐系统中应用最广泛的算法之一。然而协同过滤也面临着一系列的挑战,比如推荐准确度,数据稀疏性等问题。本文对协同过滤进行了研究。并且对基于模型的算法中基于矩阵分解和基于受限玻尔兹曼机的算法进行改进。主要工作体现在以下三个方面:第一,针对基于邻居的协同过滤算法中的两个关键因素——邻居数量和相似度算法的选择对精确度的影响展开研究。并对比了基于内存的几种协同过滤算法在Movielens数据集上的推荐准确度差异。第二,在基于矩阵分解的协同过滤中分别融入了用户评分的时间信息,用户特征信息与项目特征信息,融入了时间上下文相关的用户与项目偏置、用户注册信息偏置、项目特征信息偏置等,提出了一种改进算法:FeatureTRSVD算法。第三,对基于受限玻尔兹曼机的协同过滤算法进行改进,将项目当作单独的受限玻尔兹曼机进行训练,采用带mini-batch的批量梯度下降算法进行参数学习,提出并实现了基于项目的受限玻尔兹曼机协同过滤算法。实验结果表明,该方法的系统性能显著优于基于用户的受限玻尔兹曼机协同过滤,其结果也稍微优于基于SVD的协同过滤算法。
其他文献
网络安全随着互联网的兴起而产生,并随着互联网的发展而不断发展进步。在早期,人们通过对IP包的头部进行分析,发现网络流中的异常数据包,从而对IP包进行相应的处理。如今,随着网络
图像和视频中的文字包含丰富的语义信息,在很多应用中占有重要的位置,如自动标注,基于内容的图片或视频检索与分析等。由于图像和视频中的文字通常叠加在复杂的图像背景之上,现有
学位
无线传感器网络技术作为一个极具应用前景的技术,已经成为当前研究的热点。传感器节点是无线传感器网络最基本的构成元素,而运行在传感器节点的操作系统,能够有效地管理和使用有
随着面向服务计算技术的发展,互联网上Web服务的数量越来越多。面对数量众多的服务资源,如何有效地组织和管理这些服务成为了一个亟需解决的问题。分类是人们组织和管理大规模
随着网络存储系统的广泛应用,应用对其I/O性能也提出了越来越高的要求。蓝鲸集群文件系统(BWFS)采用带外数据传输的方法,分离元数据流和数据流,客户端直接访问存储设备,为应用提
作为一种计算机绘制方法,光线跟踪具有很多优点,可以比较真实、自然的模拟阴影、反射、折射等光照效果,但由于绘制速度较慢,一直没有在实时绘制中得到应用。不过,随着硬件水平的提
随着网络技术的发展,越来越多的网络服务提供商对外开放了可编程接口(API),允许用户通过API操纵分布在网络服务提供商上的数据。个人网格遵循以用户为中心的设计理念,它是支持个
美军标MIL-STD-1553B定义了一种数字时分制、命令/响应型、半双工的多路传输数据总线。该总线具有高可靠性和灵活性的特点,被广泛应用于航空航天电子系统以及一些对实时性和可
异构计算作为高性能计算领域的研究热点之一,近年来受到了广泛的关注。异构计算是指利用一组异构的计算资源共同协作完成某一项任务,这不但满足了不同类型的应用,也开发利用了系
随着网络技术和电影工业的发展,越来越多的视频内容广泛流传,而其中或多或少地存在着一些暴力内容。一方面,暴力场面容易吸引观众的注意,属于影片中的精彩内容,研究和分析暴力内容