论文部分内容阅读
随着生活节奏的加快,电子书阅读成为了一种人们在闲暇时间进行学习和娱乐的方式。当面对海量的电子书籍时,推荐系统和电子书排行榜便成为了读者快速寻找自己感兴趣书籍的入口。但在电子书的排行榜单制订方面,由于大多基于历史数据统计设置,因而缺少反映发展趋势的预测性推荐;在电子书的个性化推荐方面,由于缺少用户主动反馈的行为数据,使得推荐的准确性受到影响。因此,本文针对这些问题,开展了面向个人的电子书推荐和面向群体的电子书榜单定制两方面的研究。在电子书的个性化推荐工作方面,本文主要针对无用户主动反馈行为的电子书阅读场景进行推荐算法的研究。首先,本文对基于用户隐性反馈的电子书籍个性化推荐算法进行了改进。本文提出的算法不仅考虑阅读时长、阅读频次等用户隐性反馈,而且还考虑到读者阅读速度上的差异性,然后将这些用户的隐性反馈转换为喜好度评分来补全用户-书籍评分矩阵,最后再分别结合协同过滤(Collaborative Filtering,CF)和奇异值分解(Singular Value Decomposition,SVD)实现了个性化书籍推荐。通过对比实验证明,本文所提出的算法对电子书籍推荐的准确率有一定的提升。在电子书的群体榜单定制工作方面,本文提出了阅读量驱动(Reading quantity-driven)的电子书籍热门榜单定制算法。通过给群体用户制定一个热门书籍榜单,使榜单上书籍的阅读量最大化。针对现有的热门书籍榜单制定只是对过去的统计而不能反映书籍未来热门程度的情况,本文算法针对电子书籍未来阅读量进行预测排名,以此制定出一个热门书籍榜单。该算法主要分为基于时间衰减的随机森林分类模型(TDRF,Time-Decay Random Forest model)和基于行为数据的重排序模型(BBRR,Behavior Based Re-Ranking model)两大步,首先将行为时间衰减加入到随机森林模型中的TDRF模型,从海量电子书中筛选出潜在可能上榜的小样本电子书,然后再利用BBRR模型根据书籍的行为数据对筛选出的小样本进行重排序,得到最终预测的未来热门榜单。通过真实数据的对比实验表明,本文的方法相比传统的方法,对于排行榜上书籍的总阅读量有了明显的提升。