论文部分内容阅读
推荐系统通过预测用户的信息需求,向用户推荐其需要的资源(商品、电影等)。主流的推荐算法利用用户对资源的评分信息和资源的内容信息进行推荐,但很多应用场景还包含其他重要信息(本文把特定应用场景的这些重要信息称为领域相关信息),比如用户行为的序列信息,标签信息等,根据这些信息的特点设计定制化的推荐算法,将有助于提升推荐效果。 已有研究者尝试将不同场景的特定信息融合进推荐算法,但在推荐系统的构建过程中仍然有许多可以改进的地方:1.在推荐系统的构建初期,系统首先面临冷启动问题,现有方法在冷启动场景中的推荐效果欠佳;2.当积累到一定数量的用户行为后,系统主要基于用户的行为信息进行推荐,其中用户的行为序列具有一定的前后关联性,但现有方法在对行为序列建模时还有信息没有效利用;3.同时,用户行为类型通常是多样化的,当每种类型的行为数量足够多时,有必要区分不同行为类型对推荐效果的影响,但现有方法对行为类型的建模还有待改善;4.最后,随着推荐系统的不断完善,标签等元素被添加进来,用户、资源和这些元素会构成复杂的多元关系,但在复杂多元关系建模方面还没有合适的解决方案。针对以上问题,本文分别做了以下工作: 1.针对资源冷启动问题,本文提出了一种基于资源属性的主动学习方法。资源冷启动指系统希望将新资源推荐给用户,本文根据新资源的属性信息,使用主动学习方法获取到新资源的初始评分,以解决资源冷启动问题,并进一步使用分解机(Factorization Machines)算法进行推荐。在Movielens电影数据集和亚马逊商品数据集上的实验证明了该方法的有效性。 2.针对用户行为序列建模,本文提出了基于Time-LSTM模型的推荐算法。该算法通过长短期记忆网络(LSTM)对用户行为的序列信息建模,通过时间门对时间间隔信息建模,从而更好地捕获用户的长短期兴趣。在LastFM和CiteULike数据集上的实验证明了该方法的有效性。 3.针对不同用户行为类型建模,本文提出了基于Attention-GRU-3M模型的推荐算法。在前述Time-LSTM工作的基础上,本文针对基于注意力机制的门循环单元(Attention-GRU)模型,提出了三个重要改进(3Modifications,简称3M,所以整个模型叫Attention-GRU-3M)。该模型能同时对行为的序列性,时间间隔和行为类型建模。此外,该模型还能有效将品牌ID和品牌属性进行融合。在阿里巴巴天猫商城上的离线和在线实验证明了该方法的有效性。 4.针对复杂多元关系建模,本文提出了一种基于异构超图模型的文档推荐算法。该算法能有效利用标签信息并能很好地捕获不同类型的多元关系。在Delicious和CiteULike数据集上的实验证明了该方法的有效性。