论文部分内容阅读
电子商务的快速发展为在线用户提供了大量的商品和信息。人们比以住能够更容易、更直接地通过网络获取各种在线的商品信息。然而,网络上的信息浩瀚如海,且增长和更新的速度愈来愈快,分布在网络当中的各个角落,对于每个用户来说,尚无完善的管理结构。这就出现了“信息迷向”和“资源过载”。因此,为在线用户提供个性化推荐服务是电子商务网站的需求,也是今后的服务模式所趋。个性化推荐系统中最关键的部分是个性化推荐技术,即所采用的推荐方法和模型能有效地获取用户兴趣,尽可能推荐符合其兴趣的商品,同时也帮助网站吸引用户,提高用户的忠诚度。作为个性化推荐技术中应用最广泛和最为先进的方法之一——协同过滤推荐技术,能把与活动用户具有相似兴趣的其他用户的意见提供给活动用户。此法利用用户的历史信息计算用户之间的相似性,然后利用与目标用户相似性较高的邻居对其他产品的评价来预测目标用户对特定产品的喜好程度,系统根据这一喜好程度来对目标用户进行推荐。协同过滤推荐方法的优点就是对推荐对象没有特殊的要求,能处理书籍、音乐、电影等难以进行文本结构化表示的对象。而随着系统中用户和项目数的不断增加,在整个项目空间上用户评分数据会极端稀疏,在实际推进行推荐时,受可扩展性和低精度性影响严重,使得在个性化推荐系统中应用受到一定限制。本文提出一种新的协同推荐模型——基于粗糙集的协同推荐模型。它主要针对个性化推荐精度低的原因,认为是用户多兴趣性和用户间接评分利用不足导致了传统用户相似度的计算不能很好地反映用户之间的相似性。因此,提出将粗糙集方法引入到协同过滤推荐方法中来,形成了本文的模型。它首先通过对用户-项目评分信息在关注度层面上的粗糙用户聚类,将用户的多兴趣性描述为多用户群特性,可依据用户的评分将用户划分在多个类中,这样避免了由于用户在边界时可能导致相似性计算不准确的情况;同时,以粗糙用户类的基础上,通过对用户-项目未评分值以改进的基于粗糙集填充方法进行填充,充分利用了用户之间间接评分信息;最后使用基于偏好认定系数的方法进行新的相似度计算来进行预测和项目推荐。整个推荐过程便形成了基于粗糙集的协同推荐模型,相关推荐算法也进行了改进。在对实际数据进行分析的基础上,通过实验表明,本文提出的模型在提高协同推荐方法的推荐精度上是有效的,且受可扩展性程度影响低。最后对本文的研究做了总结,分析了本文推荐模型及算法中的一些不足,对今后的研究工作给予了展望。