基于符号数据分析的混合推荐算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:danfengtaoyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息社会中,互联网产品在为用户提供基本服务的同时,已逐渐向着社会化、移动化以及个性化的方向发展,社会化的典型代表是发展得如火如荼的SNS社交网络服务;移动化帮助用户实现随时随地网上浏览;个性化可以实现用户的专属需求。推荐系统作为个性化的实现手段,在电子商务、娱乐互动等领域受到了高度关注,成为互联网产品摆脱同质化的一个重要方式。传统基于内容的推荐算法直观易懂,却存在过度特征化和领域单一化的问题;协同过滤技术可以实现项目的跨领域推荐,自动化程度高,却受到数据稀疏性及冷启动等难题的影响。本文结合两种方法的优点,针对现有的混合推荐算法在处理海量数据时效率低下等问题,将符号数据分析方法加入到混合推荐算法中,提出两种混合思路:第一、将基于内容的推荐算法与user-based协同过滤算法进行混合,用模态符号数据对用户建模,引入模态符号数据的距离度量计算用户模型间的相似性,同时加入用户人口统计信息的相似性,由此形成用户的综合相似性,完成kNN推荐;第二、将基于内容的推荐算法与item-based协同过滤算法进行混合,使用模态符号数据对项目建模,加入非负矩阵分解算法,对项目的特征矩阵进行有效―平滑‖,以此为基础计算项目之间的相似性,完成推荐。这两种混合方法利用了基于内容推荐算法的优点,使用项目及用户的特征进行相似性比较,从而有效避免了评分矩阵稀疏性带来的影响,同时非负矩阵分解的算法也有效应对了矩阵超高维及矩阵内容稀疏的问题。实验结果表明,本文提出的两种基于符号数据的混合推荐算法与传统的user-based协同过滤算法和item-based协同过滤算法相比,在相似性计算上具有更高的效率,同时在应对数据稀疏性及新用户问题时,具有更高的推荐精度。
其他文献
正确的摄影构图,能使画面上的形像主次分明、脉格清晰,主题思想也能得到充分的、完美的表达。但在拍摄过程中,由于记者活动条件的限制,如被摄对象活动方式的变化莫测,现场环
教授:你好!rn在校外电线杆上看到招聘启事,说您欲为高龄父母找一保姆.我思来想去,觉得自己是适合这个职位的,特此应聘.rn
期刊
粉碎“四人帮”以来,新闻战线为了肃清“帮八股”的流毒,对“假”字大兴讨伐之师,引起了群众和广大新闻工作者的强烈共鸣。在大家的努力下,报纸、广播逐渐恢复和发扬了准确
中国社会科学院新闻研究所已于十月初正式成立,新闻系研究生也已入学上课。以华主席为首的党中央一举粉碎了“四人帮”以后,新闻战线呈现出一派新的气象。报纸等舆论工具真
随着经济社会的不断发展,企业的竞争成为人才的竞争.薪酬激励体系不仅是企业吸引和激励人才的有力工具,更发挥着经济杠杆的作用.随着薪酬激励在企业中的重要性日益突显,如何
最近一个时期以来,在我們的同业中,对于如何改进經济新聞的写作。展开了很热烈的討論。这个討論,不仅已經对經济新聞的改进产生了很好的推动作用,有了不少效果,而且对于我們
我是湖北竹山县擂鼓公社农村通讯员,写过不少稿子,但报刊用的很少。一方面是自己的写作水平有限,另一方面是没有抓到点子上。最近,读了《新闻战线》第九期刊登的《从农村回
地处祖国西南边疆的云南省,到今年3月25日止,已复刊和创刊的地(州)县报有10家。在边疆少数民族聚居的地区中,5个自治州有了报纸,即:德宏傣族景颇族自治州的团结报(汉、傣文
可扩展商业报告语言(ExtensibleBusinessReportingLanguage,XBRL)是一种基于互联网,可跨平台操作,专用于商业领域中数据处理的计算机语言。它独特的技术优势使得全球商业领域发