论文部分内容阅读
随着互联网和大数据技术的发展,信息过载问题日益严重。推荐系统是解决信息过载问题的有效工具,当前个性化推荐技术在电子商务平台、社交网络等领域内得到了广泛的应用。其中,学者们已经提出许多经典的基于显式反馈的协同过滤推荐算法。然而基于显式反馈的协同过滤推荐算法存在数据量少、获取方式有限和不易获取等问题,从而使得推荐性能不佳。因此为了能够更容易获取丰富的数据量,数据更多样化的基于隐式反馈的协同过滤推荐算法正逐渐成为热点。对同一用户而言,其产生的多类型隐式反馈对预测用户偏好具有不同的影响,目前大多数基于隐式反馈的协同过滤推荐算法都只是选择其中一类或是两类反馈来实现推荐,导致数据稀疏问题严重,从而使得推荐结果不够精准。若是将这些多类型隐式反馈应用到推荐算法中,可以缓解推荐系统中的数据稀疏问题。因此,本文针对基于隐式反馈的推荐方法中由于用户单一行为模式下对已有项目交互过少带来的数据稀疏问题,提出了一种基于多类型隐式反馈置信度的协同过滤推荐算法(Bayesian Personalized Ranking model with Multi-type Implicit Feedback Confidence,MTCBPR)。将用户多种行为进行互补和融合,并赋以置信度来衡量其对推荐质量的影响。通过逻辑回归和基于树的特征选择两种方法对数据集进行学习的置信度对多种类型隐式反馈进行筛选,以筛选出更有效的确定性辅助反馈,并且依据置信度来对不同类型的确定性辅助反馈的偏好表达进行量化。通过在公开数据集sobazaar上进行数据处理和实施对比实验,得到实验结果:本文所提出的MTCBPR算法在所采用的评价指标上都优于基准算法,能够进一步缓解数据稀疏问题,全面诠释用户的偏好和意愿,有效提高推荐性能。另外,为验证MTCBPR算法在其它真实数据集上的可行性,通过第三方软件获取互联网健康服务平台上用户的多类型隐式反馈,主要包括用户的预约挂号、网上咨询名医、查找名医和访问名医个人空间这几种典型的历史行为,整理成数据集Topmd。实验结果表明,MTCBPR算法在该场景下仍具有较好的推荐效果。