论文部分内容阅读
本文中的项目是作者在百度公司实习所参与的项目,该个性化推荐系统旨在提高用户的体验度,降低用户的选择成本,给用户提供不搜即得的资源,并且增加百度用户的黏性,提升糯米的销售额等。本系统包括离线计算模块和在线推荐模块,作者全程参与了整个项目的设计与实现工作。在需求分析阶段,与相关人员进行沟通,确定了项目的整体需求。之后根据需求分析确定了项目的整体设计,划分了功能模块。整个系统被划分为两个一级模块和六个二级模块,两个一级模块分别是离线计算模块和在线推荐模块。离线计算模块负责系统离线计算部分,划分为三个二级模块,主题模型离线计算模块、协同过滤离线计算模块以及逻辑回归离线计算模块。三个二级模块分别对应系统中使用到的三种算法,每个模块负责对应算法的模型训练工作。在线推荐模块负责系统在线推荐部分,同样划分为三个二级模块,其中主题模型在线推荐模块、协同过滤在线推荐模块根据离线计算训练的模型为用户生成推荐结果;推荐结果再处理模块负责对推荐结果进行一系列再处理工作,其中包括了利用训练好的逻辑回归模型对推荐结果进行重排序。在开发完成后,作者还针对系统中的各个算法进行了效果的评测,并将整体服务进行了线上测试。本文中的个性化推荐系统在测试中表现良好,推荐产生的内容点击率比随机产生的内容有了很大的提升。这说明个性化推荐系统能够根据用户的历史信息给出用户感兴趣的推荐结果,达到了预期的水平。