整合领域相关信息的推荐系统

来源 :浙江大学 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统通过预测用户的信息需求,向用户推荐其需要的资源(商品、电影等)。主流的推荐算法利用用户对资源的评分信息和资源的内容信息进行推荐,但很多应用场景还包含其他重要信息(本文把特定应用场景的这些重要信息称为领域相关信息),比如用户行为的序列信息,标签信息等,根据这些信息的特点设计定制化的推荐算法,将有助于提升推荐效果。  已有研究者尝试将不同场景的特定信息融合进推荐算法,但在推荐系统的构建过程中仍然有许多可以改进的地方:1.在推荐系统的构建初期,系统首先面临冷启动问题,现有方法在冷启动场景中的推荐效果欠佳;2.当积累到一定数量的用户行为后,系统主要基于用户的行为信息进行推荐,其中用户的行为序列具有一定的前后关联性,但现有方法在对行为序列建模时还有信息没有效利用;3.同时,用户行为类型通常是多样化的,当每种类型的行为数量足够多时,有必要区分不同行为类型对推荐效果的影响,但现有方法对行为类型的建模还有待改善;4.最后,随着推荐系统的不断完善,标签等元素被添加进来,用户、资源和这些元素会构成复杂的多元关系,但在复杂多元关系建模方面还没有合适的解决方案。针对以上问题,本文分别做了以下工作:  1.针对资源冷启动问题,本文提出了一种基于资源属性的主动学习方法。资源冷启动指系统希望将新资源推荐给用户,本文根据新资源的属性信息,使用主动学习方法获取到新资源的初始评分,以解决资源冷启动问题,并进一步使用分解机(Factorization Machines)算法进行推荐。在Movielens电影数据集和亚马逊商品数据集上的实验证明了该方法的有效性。  2.针对用户行为序列建模,本文提出了基于Time-LSTM模型的推荐算法。该算法通过长短期记忆网络(LSTM)对用户行为的序列信息建模,通过时间门对时间间隔信息建模,从而更好地捕获用户的长短期兴趣。在LastFM和CiteULike数据集上的实验证明了该方法的有效性。  3.针对不同用户行为类型建模,本文提出了基于Attention-GRU-3M模型的推荐算法。在前述Time-LSTM工作的基础上,本文针对基于注意力机制的门循环单元(Attention-GRU)模型,提出了三个重要改进(3Modifications,简称3M,所以整个模型叫Attention-GRU-3M)。该模型能同时对行为的序列性,时间间隔和行为类型建模。此外,该模型还能有效将品牌ID和品牌属性进行融合。在阿里巴巴天猫商城上的离线和在线实验证明了该方法的有效性。  4.针对复杂多元关系建模,本文提出了一种基于异构超图模型的文档推荐算法。该算法能有效利用标签信息并能很好地捕获不同类型的多元关系。在Delicious和CiteULike数据集上的实验证明了该方法的有效性。
其他文献
网格计算技术为跨管理域的资源安全共享和提高资源利用率提供了有效支持。在基于网格平台的实际应用系统中,除了计算、存储、数据资源外,还存在着大量的应用软件和工具资源。很
多线程技术是构造下一代分布式应用的基本技术。通过将分布式应用对于Web应用服务器的多线程服务需求提取出来,以统一的编程模型提供给用户,Work Manager是目前构建基于Web应用
密码算法是信息安全领域的重要研究内容,算法的安全性由诸多因素决定,包括算法自身的数学特性以及实现安全性等。近年来,基于实现的算法攻击获得了广泛关注并已成为研究热点之一
在开放、动态的网络环境中,分布式软件呈现出规模庞大、松散聚合、行为复杂等特点,分布式软件自身的特点、复杂多变的网络环境以及用户需求的不断更变,需要对其进行动态的适
本文重点对超图划分和空间填充曲线两类方法进行比较研究。在大规模科学计算中,并行计算效率提升的一个关键在于将数据进行剖分,分配到相应处理器中,以及对处理器中的数据进行动
作为一种无需预设设备支持的无线移动网络,移动自组网的研究越来越多地得到人们的关注,特别是对网络性能有重要影响的路由协议的研究。由于移动自组网中的节点采用电池一类的可
软件测试是伴随软件开发全过程的重要活动。测试管理帮助企业制定软件测试流程,管理测试人员,规范测试运行,分析测试结果,是保证软件测试质量的主要手段。   软件测试模型是软
本文介绍了移动计算领域一个较为年轻的新课题——位置相关数据。位置相关数据是一种向移动用户提供即时、即点信息服务的技术。通过位置相关服务用户在移动过程中可以获得与
流程企业生产过程反映了企业的工艺路线、资源配置及其制造能力,生产过程的稳定运行影响着产品生命周期的各个阶段,因此进行生产过程的实时监控非常必要。生产过程中的大量装置
InfiniBand(IB)是I/O技术领域的一种新型体系结构,提供具有低延迟、高带宽特性的RDMA传输方式,为提高集群通信性能提供了支持。当前在Java应用程序中使用构建于InfiniBand网络