基于时变的日志挖掘和协同过滤算法的图书推荐系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:qq969023319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时至今日,数字图书馆已经走过了一段相当长的发展历程。随着馆藏资源由“信息匮乏”转为“信息过载”,数字图书馆建设也从初期的基础建设、资源积累、技术开发,朝着更深、更广层面上的主动服务方向迈进。面对“信息过载”的现实,帮助用户迅速、准确地推荐出有用信息的图书馆“个性化推荐服务”成为数字图书馆领域的研究热点之一。 将日志挖掘和协同过滤相结合是当前个性化推荐研究中一个方向,但目前的基于此的推荐系统普遍存在冷启动的问题;同时一般的日志挖掘普遍忽视了新老日志在挖掘用户当前兴趣上所存在的差异,即:越临近的日志越能反映用户当前的兴趣。这两个问题,严重地影响着个性化系统推荐的质量和推荐效果。此外,在高校读者中,高校在校本科学生是一个重要的用户群体,不同学期不同专业选修不同课程的学生对文献有着不同的需求。目前针对这类群体,尚没有合适的个性化推荐系统能更好地根据其近期的兴趣情况推荐合适的图书供其借阅。 本文作为中国高等教育数字图书馆(CADLIS)项目中的子课题,针对高校本科生这一用户群的特殊性,围绕用户身份的相似性和历史借阅日志,引入时变因素,提出了一种改进的带时变影响的借阅日志挖掘算法和带时变影响的邻居用户计算算法,从而能有效解决上述两个问题: (1)在带时变影响的借阅日志挖掘算法中,把“时间衰退因子”引入到类别偏好度计算中,从而能合理地体现现实中越临近的用户借阅日志越能反映用户当前兴趣这样的一个特点,由此,推荐的质量得以提高。 (2)在带时变影响的邻居用户计算算法中,对于协同过滤算法所依赖的邻居用户的计算,不再是单纯依赖历史借阅日志计算出的兴趣相似性,而是将基于借阅日志计算的兴趣相似度和已知的用户身份属性信息的相似度根据用户在校时间情况加以叠加运算,最终解决冷启动的问题。 此外,通过充分研究并借鉴已有的推荐系统的研究成果,本文所完成系统的设计与实现,较好地解决了推荐自动化、用户数据稀疏性、服务实时性等设计和实现上的难点问题,并充分考虑了不同层次的本科学生对不同类型文献的个性化推荐需求,提高了推荐系统的实用性。
其他文献
随着移动通信与互联网的普及,移动业务尤其是数据业务呈现出迅猛的增长势头,业务种类日益丰富。目前存在的大部分移动应用平台由于自身体系结构的缺陷,无法迅速高效的把各种业务
西施舌人工育苗过程中,附着变态阶段常发生大量幼体变态延迟及死亡的现象,使附着变态成为制约大规模生产的瓶颈之一。本研究探讨了附着变态的影响因子及化学诱导技术,以期改进西
本文首先在对传统信息检索的检索原理与实现技术进行分析的基础上,分析了传统信息检索的局限性和智能检索的技术特点与优势。认为基于关键词匹配的检索方法是导致其现有局限性
机载SAR天线稳定平台是保证雷达能够大面积连续成像的基本条件。高精度、高稳定度的天线稳定平台是高分辨率机载SAR关键技术之一。 现有机载SAR天线稳定平台多采用模拟控
随着网络和多媒体技术的广泛应用,集成化、数字化和网络化的网络数字监控系统已逐步开始取代传统的视频监控装置。与传统的视频监控系统相比,网络数字监控系统有许多优势,如数字
基于IP网络的视频会议系统可以实现在网络上实时地传输视音频信息以及共享数据,使与会者之间可以不受空间限制进行直观、真实的面对面的交流。视频会议系统在远程医疗、远程教
人工耳蜗是帮助全聋人恢复听力的一种医疗仪器,其基本原理是用微弱电流脉冲直接刺激聋人耳蜗内的听神经,使聋人恢复听觉。   言语信号处理方案一直是人工耳蜗中的关键技术。
传统的影像镶嵌技术经常由于两幅影像的几何差异和辐射差异,使得镶嵌结果出现模糊和假边界.在实际的镶嵌过程中,由于各种累计误差使得纠正过的正射影像在拼接时也存在困难:由于
水稻长护颖突变体Long glume(lg)是从育种中间材料中发现的一个花器官自然突变体,突变体的护颖长于果实总长,花器官的其余部分均正常。遗传分析表明,该突变体性状受一对隐型单基因控制。双子叶植物花器官发育的ABC 模型已基本成熟,以水稻为代表的单子叶植物花器官发育模式目前尚无定论,护颖是对应于单子叶的花萼或花瓣?或两者都不对应?目前都是猜测。研究水稻长护颖突变体对完善和补充单子叶植物花器官发育
传感器的成像几何模型的建立是进行摄影测量立体定位处理的基础,它反映了地面点三维空间坐标与相应像点的像平面坐标系中二维坐标空间的数学关系,一般分为两类:基于共线方程法的