论文部分内容阅读
目前,协同过滤推荐技术已在广告、电影、音乐等领域得到广泛应用。然而,在不同的应用背景下,传统的协同过滤推荐算法在兴趣偏好模型、相似性度量方法、邻居选择规则等方面仍存在亟待进一步解决的问题。因此,本文面向广告推荐、电影推荐两个应用场景,引入标签技术和可信邻域思想,侧重研究了面向用户的协同过滤推荐算法。本文主要进行了以下研究工作:1、研究提出了一种带标签的协同过滤广告推荐算法ADR-CF_T(Advertising recommendation algorithm based on collaborative filtering with tag)。该算法在面向用户的协同过滤的广告推荐算法的基础上,引入标签推荐技术,通过建立Q-K-A(Query-Keywords-AD)搜索广告兴趣模型,采用Query页加权综合相似度度量方法,对搜索广告的兴趣偏好进行完整描述,也保证了邻域计算的准确性。KDD CUP 2012中track2数据集上的参数调节、可扩展性验证、推荐质量对比等实验结果表明,ADR-CF_T算法是有效可行的,在准确率、召回率、F度量值方面得到了有效改善。2、研究提出了一种基于可信邻域的协同过滤电影推荐算法FCFRA-TN(Film Collaborative Filtering Recommendation Algorithm Based on Trust Neighbor)。该算法通过增强相似度、动态邻域选择方法、信任度计算模型来优化传统面向用户的协同过滤电影推荐算法,既对用户间的相似性正确地定义,也充分地过滤邻居用户集合。MovieLens数据集上的实验表明,FCFRA-TN算法在邻居选择策略和信任计算方面提出的优化是有效的,与其他相关推荐算法相比,具有更低的MAE值且推荐质量得到了显著提高。本文研究贡献:从兴趣偏好模型、相似度度量方法、相似度描述、邻居选择策略、可信度计算等方面对传统面向用户的协同过滤推荐算法进行优化,并应用于广告推荐和电影推荐场景。实验结果表明,优化所提出算法是有效可行的。