论文部分内容阅读
信息时代的发展使得人们能够快速方便的通过新闻网站(Google News, Yahoo News)和移动应用(CNN Mobile)浏览世界各地发生的新闻。然而,大量的新闻不间断的产生导致用户信息过载,使得用户很难快速发现符合自身兴趣的新闻。因此一个重要的研究课题就是如何帮助在线读者自动发现满足用户兴趣的新闻,推送给读者,称为个性化新闻推荐。基于不同策略的新闻推荐系统已经被广泛应用到在线新闻阅读服务中。本文主要研究新闻推荐中的冷启动问题和数据稀疏性问题,并提出基于隐式专家和近邻的混合推荐框架PRemiSE,主要包含以下内容:第一,如何缓解数据稀疏性问题?大部分用户历史阅读行为较少造成得到的反馈或者评分数据比较稀疏,导致传统推荐方法不能有效的获取用户访问模式计算用户或者物品之间的相似性。第二,如何缓解冷启动问题?包括用户冷启动和物品冷启动两方面,指对于新发布的新闻或者新注册的用户该如何进行推荐。在线阅读用户不断的加入和新闻的动态产生使得冷启动问题在该课题中尤为重要。第三,极少的工作研究了“专家”在推荐系统的作用,我们提出PRemiSE混合推荐框架,通过概率矩阵分解(Probabilistic Matrix Factorization)融合新闻文本内容,协同过滤和隐式用户传播网络。基于用户阅读偏好,新闻语义信息,隐式专家意见更准确的生成预测评分。在真实新闻数据集上做了详细的数据分析和实验验证,验证基于用户访问日志来构建隐式用户网络的可行性和有效性。基于该网络提取隐式专家,然后集成近邻偏好和隐式专家意见有效的缓解了用户和新闻冷启动问题。利用新闻中的命名实体刻画用户兴趣并填充原始评分矩阵缓解了数据稀疏性问题,同时新闻文本的潜在主题分析使得推荐结果具有语义解释性。