用户兴趣自适应的个性化推荐系统的设计与实现

被引量 : 13次 | 上传用户:liongliong570
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统被广泛应用于电子商务中,旨在为用户提供推荐列表帮助他们定位喜欢的物品。本个性化推荐系统为比购网站所设计,为反映每个用户兴趣的动态变化,利用隐、显式混合反馈方式对用户兴趣建模;设计了基于用户和聚类的混合协同过滤算法的方案,以满足为用户提供潜在感兴趣的未知商品信息的要求。本系统的主要功能模块包括:数据预处理、用户兴趣建模、数据挖掘、产生推荐以及客户端代理模块。本人全程参与了前四个主要模块的设计与实现工作。具体的工作可概括为:(1)参与了本系统的需求分析。(2)具体设计和实现了相关核心模块:数据预处理模块的设计与实现,主要负责对日志数据进行清洗、过滤和分词,确定关键商品词及其对应发生时间、浏览持续时间。本人采用CNZZ (Chinese Network Zhan Zhang,中国互联网站长)工具来完成一部分日志预处理工作,并将中科院开源的分词器ICTCLAS (Institute of Computing Technology Chinese Lexical Analysis System,计算所汉语词法分析系统)合并到系统中。兴趣建模模块的设计与实现,包括用户兴趣初始建模和自适应更新用户兴趣模型。模型的更新对于长、短期兴趣采取不同的方法:短期兴趣使用简单的时间窗口机制,长期兴趣使用基于时间遗忘策略。数据挖掘模块的设计与实现,使用k-means算法完成相似用户聚类。产生推荐模块的设计与实现,完成邻居圈定,并以前N方式推荐商品。(3)完成了系统的测试工作。本文最后设计了一个实验,利用20个用户注册使用15天的数据进行分析,以MAE(Mean Absolute Error,平均绝对误差)为评价指标测试推荐性能。实验结果表明,由于数据集有限且稀疏,根据邻居集大小的不同,推荐误差范围在0.861和0.958之间。本文实现的系统能够不仅推荐了与用户浏览商品相关的商品,还推荐了用户潜在感兴趣和需要的商品。
其他文献
为解决群众"看病难,看病贵"的问题,探讨医院实行单病种限价收费改革的可行性。主要作法包括:成立相应组织,进行思想动员,认真筛选病种,精确测算费用,加强运行督导。经过一年
作为广汽乘用车品牌的第一款中级轿车,广汽传祺Trumpchi传承了欧洲领先的造车技术,并融合了日本精致的造车工艺。优雅的流畅造型、卓越的驾驭性能、尊贵的科技感注定了广汽传
自课程研究的概念重建以来,课程学家们通常综合地、折中地吸取现象学、自传、存在主义、实用主义、美学、神学、解构主义、后结构主义、女权主义、解释学、混沌理论和批判理
目的探讨穴位按摩对前列腺肥大患者导尿成功率的影响。方法选取前列腺肥大患者91例,随机分成实验组和对照组,实验组在常规导尿方法的同时加用穴位按摩。对照组采用常规导尿方
20世纪90年代以来,为了应对经济全球化的形势,西方各国逐渐放弃了货币供应量作为货币政策中介目标的手段,而利率手段正在取代货币供应量成为货币政策的中介目标。货币政策作
当前,企业间的竞争日益激烈,处在社会系统中的任何一个企业都不是“孤岛”,必然与其他企业组织产生信息和物质的交换,尤其是在信息技术不断进步的今天,企业间的竞争已经演变
目的研究影响癌症初期放、化疗患者生活质量的因素,探讨提高其生活质量的护理对策。方法采用欧洲癌症研究与治疗组织的生活质量核心量表(EORTC quality of life core questio
早在1986年,学界就指出“以‘近’、‘现’、‘当代’分期来对中国现代文学进行分期不科学”。②因此,笔者在此不打算讨论中国现当代文学内部的分段问题,而径直将其看成一个
我国的物流企业,其绩效管理往往缺乏规范性,绩效管理无法服务于企业发展战略,究其原因,主要是因为,物流企业的行业特点,其工作性质强调分工协作,管理、决策、作业分离,各司其
较长一个时期,对古代文学和现代文学的分期研究成为文学史建构和文学学阐释的书写惯例,而这种“二元对立”的研究模式所带来的问题也日渐突出。本文从文化学方法论出发,对古代文