论文部分内容阅读
推荐系统被广泛应用于电子商务中,旨在为用户提供推荐列表帮助他们定位喜欢的物品。本个性化推荐系统为比购网站所设计,为反映每个用户兴趣的动态变化,利用隐、显式混合反馈方式对用户兴趣建模;设计了基于用户和聚类的混合协同过滤算法的方案,以满足为用户提供潜在感兴趣的未知商品信息的要求。本系统的主要功能模块包括:数据预处理、用户兴趣建模、数据挖掘、产生推荐以及客户端代理模块。本人全程参与了前四个主要模块的设计与实现工作。具体的工作可概括为:(1)参与了本系统的需求分析。(2)具体设计和实现了相关核心模块:数据预处理模块的设计与实现,主要负责对日志数据进行清洗、过滤和分词,确定关键商品词及其对应发生时间、浏览持续时间。本人采用CNZZ (Chinese Network Zhan Zhang,中国互联网站长)工具来完成一部分日志预处理工作,并将中科院开源的分词器ICTCLAS (Institute of Computing Technology Chinese Lexical Analysis System,计算所汉语词法分析系统)合并到系统中。兴趣建模模块的设计与实现,包括用户兴趣初始建模和自适应更新用户兴趣模型。模型的更新对于长、短期兴趣采取不同的方法:短期兴趣使用简单的时间窗口机制,长期兴趣使用基于时间遗忘策略。数据挖掘模块的设计与实现,使用k-means算法完成相似用户聚类。产生推荐模块的设计与实现,完成邻居圈定,并以前N方式推荐商品。(3)完成了系统的测试工作。本文最后设计了一个实验,利用20个用户注册使用15天的数据进行分析,以MAE(Mean Absolute Error,平均绝对误差)为评价指标测试推荐性能。实验结果表明,由于数据集有限且稀疏,根据邻居集大小的不同,推荐误差范围在0.861和0.958之间。本文实现的系统能够不仅推荐了与用户浏览商品相关的商品,还推荐了用户潜在感兴趣和需要的商品。