论文部分内容阅读
随着互联网的高速发展,网络新闻已经成为人们获取信息的重要途径。传统的新闻门户虽然拥有海量信息,却只是扮演信息集合的角色。用户只能被动式地浏览网站提供的信息,查找需要的内容。如何为每个用户提供快捷准确、满足个人实际需要的信息,已成为众多业内人士日益关注的问题。而新闻推荐系统能有效的解决上述问题,已成为互联网用户的迫切需要。
本文设计实现了一个灵活的的推荐引擎,该框架能适应各种不同数据源,组合不同的推荐算法产生推荐结果。在此基础上,本文提出了一种混合推荐算法,设计并实现了一个为爱读爱看网提供服务的推荐系统,该系统旨在为网站提供针对用户的个性化新闻推荐服务。系统通过对新闻进行自动分类、关键字提取等操作将新闻进行划分,实现新闻按分类导航浏览功能;通过用户行为的分析建立和更新用户的兴趣模型,通过推荐引擎为用户推荐感兴趣的文章。
本文主要包括三个方面的工作。第一,提出了一种基于项目内容和条件概率的混合推荐算法。该算法可以在运行时增量更新计算模型,能快速响应请求,结合了基于内容和协同过滤算法的优点,既在一定程度上解决了协同过滤算法中的评价矩阵稀疏性问题,也避免了基于内容推荐带来的均衡效果。试验结果表明,该算法在满足实时性要求的前提下,提供了较高的准确性。第二,设计实现了一个灵活的推荐引擎。其中的推荐策略框架能组合协调各种推荐算法,针对不同推荐场景选择合适的算法执行推荐任务。其中的数据入库接口、推荐接口和评价接口使框架能很好的适应不同的应用环境。第三,以爱读爱看网报刊频道为应用背景,基于上述推荐引擎,设计实现了基于LDA特征降维、量化用户模型、基于上述混合推荐算法的推荐系统。