面向电子书的个性化推荐与群体榜单定制算法研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:LEOBB_DB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生活节奏的加快,电子书阅读成为了一种人们在闲暇时间进行学习和娱乐的方式。当面对海量的电子书籍时,推荐系统和电子书排行榜便成为了读者快速寻找自己感兴趣书籍的入口。但在电子书的排行榜单制订方面,由于大多基于历史数据统计设置,因而缺少反映发展趋势的预测性推荐;在电子书的个性化推荐方面,由于缺少用户主动反馈的行为数据,使得推荐的准确性受到影响。因此,本文针对这些问题,开展了面向个人的电子书推荐和面向群体的电子书榜单定制两方面的研究。在电子书的个性化推荐工作方面,本文主要针对无用户主动反馈行为的电子书阅读场景进行推荐算法的研究。首先,本文对基于用户隐性反馈的电子书籍个性化推荐算法进行了改进。本文提出的算法不仅考虑阅读时长、阅读频次等用户隐性反馈,而且还考虑到读者阅读速度上的差异性,然后将这些用户的隐性反馈转换为喜好度评分来补全用户-书籍评分矩阵,最后再分别结合协同过滤(Collaborative Filtering,CF)和奇异值分解(Singular Value Decomposition,SVD)实现了个性化书籍推荐。通过对比实验证明,本文所提出的算法对电子书籍推荐的准确率有一定的提升。在电子书的群体榜单定制工作方面,本文提出了阅读量驱动(Reading quantity-driven)的电子书籍热门榜单定制算法。通过给群体用户制定一个热门书籍榜单,使榜单上书籍的阅读量最大化。针对现有的热门书籍榜单制定只是对过去的统计而不能反映书籍未来热门程度的情况,本文算法针对电子书籍未来阅读量进行预测排名,以此制定出一个热门书籍榜单。该算法主要分为基于时间衰减的随机森林分类模型(TDRF,Time-Decay Random Forest model)和基于行为数据的重排序模型(BBRR,Behavior Based Re-Ranking model)两大步,首先将行为时间衰减加入到随机森林模型中的TDRF模型,从海量电子书中筛选出潜在可能上榜的小样本电子书,然后再利用BBRR模型根据书籍的行为数据对筛选出的小样本进行重排序,得到最终预测的未来热门榜单。通过真实数据的对比实验表明,本文的方法相比传统的方法,对于排行榜上书籍的总阅读量有了明显的提升。
其他文献
“有的人死了,他还活着。”王益群走了,却给人们留下了悠长的思念和由衷的敬佩。思念和敬佩,不是因为她有惊天动地的壮举,而是在有限的生命里,把对群众的一腔深情,化作实实在
期刊
钢筋混凝土结构因耐久性不足而造成的损失惊人,混凝土腐蚀与结构耐久性紧密相连。钢筋混凝土结构腐蚀直接或间接与水有关。硅烷膏体防护剂凭借优异的防水性能、渗透性和耐久性
本刊说,文化是湘菜之根;多元是湘菜之体;湘菜成就湖湘品牌;湘菜拉动经济发展。湘菜要发展,就要做文化,做品牌。要用湖湘文化的精华元素,丰富湘菜底蕴,提升湘菜品位,让湘菜品
我国车用能源供应安全问题突出,需要开发廉价、清洁的车用燃料。煤炭是我国中长期发展中可以依赖的能源资源,将煤炭转化为替代燃料或者发电作为车用能源,有可能是解决我国日
高校音乐专业视唱练耳课程应该加大民族民间作品的比重,尤其应该根据地域性特征选择地方性音乐作为教学素材.以安徽省高技音乐专业为例,对地方音乐进入高校音乐专业视唱练耳
针对当下网络媒体环境下的风险社会危机常态化的网络舆情情况,提出了管理建立网络舆情引导下的舆论管理研判机制,通过科学合理的网络民意互动表达和相关传播机制的有效管理,
企业在市场经济发展,外资引进,产业组织优化升级的背景下深受产品市场竞争的影响。产品市场竞争对公司绩效的意义非凡。董事会独立性作为董事会重要特征之一,所以我们研究产
《普通高中英语课程标准(2017年版)》提出教师不仅要帮助学生加深对文化异同的理解,提高对中外文化异同的敏感度,还要帮助其理解英语中常见成语及俗语背后的文化内涵,以及交
设计了一个以水杨酸和乙酸酐为原料,以HZSM-5分子筛为催化剂,在室温或加热条件下高效合成乙酰水杨酸的半微量有机化学实验。与经典实验方法相比,新实验具有反应易于操作、产
随着全球贸易一体化的不断深入、国际经济的飞速发展联动了"一带一路"沿线国家及地区的经济发展,孕育出与沿海港口极具类似的、依托于铁路集装箱多式联运的西安国际港务区。